AI 开发——改了一个浏览器翻译插件

瓦解

w4j1e

2025年12月7日 12:30

前言

在《我在用什么浏览器翻译插件？》这篇博文里我提到过我对浏览器翻译插件的体验和需求，那时候用了一阵子的 trancy，后来不知何时就弃用了，当时我就提到过，这不是我理想中的翻译插件（个人主观原因）。

在简单导航（simpleNav）基本不必再改动之后，我又萌生了改一个停更开源翻译插件的想法，虽然很早之前就有过，但 codebbudy 没能给我足够的信心。现在换上了 trae solo，我觉得效率上起码要高出不少。

选择

选择项目

停更许久的翻译插件大多是翻译接口失效或者不好用，看起来只需要替换接口就可以，所以我想找的是轻量，且使用体验比较适合我的项目。对比了一下轻氧翻译和侧边翻译，我最终选择了后者。

侧边翻译是我曾使用过很长一段时间的翻译插件，可惜已经停更很久了。加上现在各大翻译插件都有 AI 模型的加持，传统的机翻很难满足要求。

为了避免误导其他人，所以在遵循原项目的开源协议前提下，把这个新项目命名为“轻量翻译”，英文名：lightrans。

选择接口

既然不要机翻，又要考虑到公开给大众使用，就不能有高昂的开支，所以我首先想到的是用智谱清言的官方 api 调用 GLM 4.5-Flash，但是并发数限制得非常低，加上翻译速度没有达到我期望的即点即译，于是作罢。

好在我又体验了一下 trancy，发现 trancy 也没有免费提供 GLM 模型，而是改成了硅基流动。于是我注册了硅基流动的账号，发现居然有免费的模型可以使用！硅基流动真是带善人！

感谢硅基流动提供的免费模型

首先体验的是 deepseek 的一个模型，翻译速度也很慢（我猜测是因为有推理思考过程），在网上多方了解，发现Hunyuan-MT-7B倒是一个不错的专为翻译而生的小模型，腾讯混元官方的 api 依然是收费的，还好硅基流动限免提供使用。最后我选择了三个体量都不大的小模型：Hunyuan-MT-7B、Qwen2.5-7B-Instruct和GLM-4-9b-chat。

这三个模型除了混元比较新之外，另外两个都算比较老的模型了，没办法，不花钱嘛，况且效果也不是不好。

根据我的用量级别，我使用这几个模型的速率限制为：1000 RPM 和 80000 TPM。即每分钟请求数1000，每分钟处理 token 数80000。

开改

精简代码

侧边翻译不是个人开发者的作品，应该类似于一些较大的开源项目组织维护，所以侧边翻译里有非常丰富和强大的功能及代码。考虑到我只需要接入一个翻译接口，于是必应、谷歌和百度等翻译接口都删掉了。

初次以外还删掉了分析代码、隐私政策、部分设置项和个别国家的本土化适配等等，源代码从14MB缩减到4.5MB。

添加翻译器

由于我选择的三个模型都是对话模型，所以请求的 api 地址一样，于是我只创建了一个 aitrans 的翻译器，方便测试就在代码里明文写了我的私钥，经过测试，对话框（popup）翻译正常，划词翻译正常，但是网页翻译不正常。

修改

原本的侧边翻译的对话框默认是搜索的，输入文本点击翻译后即会在侧边栏显示翻译结果，但是测试了一下目前的翻译接口都已经失效了。为了获得输入和获取结果的一致性，即当前对话框不会被打断关闭而显示另一个对话框，我改了 popup 的样式，并使它能够直接在当前窗口显示结果。

侧边翻译的对话框

lightrans的对话框翻译

除了对话框以外，侧栏显示翻译也会让人的视线离开当前关注的区域，所以我把划词翻译的结果也以浮动的卡片形式显示在了当前位置，并且和原来一样支持拖动。以下是划词翻译中三个不同模型结果的对比（发音按钮点击无效，功能删了但是还没删按钮）：

lightrans混元模型划词翻译

lightrans千问模型划词翻译

lightransGLM模型划词翻译

当然，用不着的设置项也可以删掉，因为我的需求没有那么丰富（不然就用 trancy了），为了追求极简但好用，所以砍掉了许多原本有的功能，也为后面的修改和维护减轻一点负担。

侧边翻译的设置页

轻量翻译的设置页

看起来基本可以正常使用了，但是网页全文翻译依然不行。原项目使用的是谷歌和有道，但是有道已经下线了，谷歌在国内也无法直接访问，看来要支持网页翻译需要改动的还挺多。

中间的过程就不再赘述了，除了新增代码，调试代码之外，还要测试不同的请求频次和字符数，以免触发硅基流动限频的策略。

和原项目一样支持右键选择翻译模型

一开始选中模型进行网页翻译，往往要过十来秒钟页面才会有变化。或许是内容太多了模型处理也要时间吧，于是我设定了分批次提交，最高并发三个，最多重试三次。所以在进行网页翻译的时候可以看到内容是一部分一部分出来的，但是间隔不算大（主要是网页本身的菜单栏花的时间多，正文其实很快）。这样用户能感知到翻译已经开始了，而不是像之前一样等待了十来秒都没反应，于是不断尝试，就更容易触发限频。

lightrans贴一段代码

从翻译结果来看，不知道为什么千问模型会漏掉几个词语不翻译，也可能是我的代码有问题，相比之下，混元模型翻译得还不错，有些专有名词甚至会加括号解释说明。比如昨天在新华网英文站翻译页面时，发现它会解释“GuoChao”这一个词汇，但是我没找到那篇新闻，只能找另一个，没想到也复现了。

上方是翻译，下方是原文

这是更完整的页面翻译。

lightrans使用混元的网页翻译

最后

通过这次改写这个开源项目，我才发现原来微软的机翻 api 也是要钱的，那么多较大的翻译插件都把谷歌和微软翻译免费使用，甚至开放一些 AI 模型翻译免费使用，这样看起来他们真的是在为爱发电了。

而我能轻松改写这个项目，要感谢侧边翻译的开发者们的开源，也要感谢 trae solo 的帮助。考虑到我的 api 限频问题，所以暂时没想过上架应用商店，但是如果愿意体验并且给我提出意见的话，也欢迎下载扩展包尝试一下。

项目地址：hin/Lightrans · CNB

扩展包下载：lightrans_chrome.zip | w4j1e’s drive

龙Ge笔迹
利用deepseek，一晚上迭了超过30代，也算过了一把wordpress插件瘾 2025年2月15日 16:09

利用deepseek，一晚上迭了超过30代，也算过了一把wordpress插件瘾

龙Ge笔迹

2025年2月15日 16:09

一直以来都是网站爱好者，就算说现在搞网站的越来越少，但是这个持续了20年左右的爱好，却一直没放下，从html代码到joekoe到再到discuz、phpcms再到现在唯一留存的wordpress，一 ...

夜未央
cherry studio本地部署AI经验及开放平台推荐 2025年12月3日 11:05

cherry studio本地部署AI经验及开放平台推荐

夜未央

水拍石

2025年12月3日 11:05

近日为了构建本地知识库，所以研究了cherry studio的部署过程。尽管最终的结论是本地部署还不如直接用开 […]

我的天
浑身瑕疵 2025年12月3日 08:23

浑身瑕疵

我的天

xrspook

2025年12月3日 08:23

有时候我还真不明白，为什么现在大家把AI吹得那么牛逼。因为就是我的使用体验而言，我觉得在写代码的时候，AI真的是挺糟糕的.我用的AI是Deepseek。

理论上无论我用的是什么AI，它们都应该是写代码的高手，无论是写什么类型的代码都应该没什么问题。我这么低端的用户，也不会提出一些什么高端的要求，但事实证明，不知道是我提要求提的不够精准还是怎么着，反正出来的结果我个人感觉基本上没有一次就能符合我的要求。有些时候的确能接近生成我想要的结果，但更多时候那串代码当你复制下来运行的时候会发现根本运行不了。对一个什么都不知道的小白在代码运行不了的时候可以怎么办呢？换一个AI继续提问继续复制粘贴？但如果这个AI有问题，其它AI会不会也有问题呢？为什么人家觉得那个玩意那么神奇，但我自己的使用体验却那么差呢？是不是因为AI已经判断出我这个人是个挑剔的完美主义者，所以故意给我些有瑕疵的东西？每一次都有瑕疵，每一次的瑕疵都说不准在什么地方，幸好绝大多数情况之下，我要的不是AI的全过程，我只是要参考一下它的思路而已。当我要求它给我写某个代码的时候，实际上我更看重的是它用什么途径，而不是它的代码具体是什么。如果它的代码能顺利运行，那当然好，但实际上我感觉一次性就能成功运行的几率可能不足10%。

当我给出一串数字，要求它给我做数据分析。噼里啪啦一大段字很牛逼，一贴进去发现根本出不了结果，仔细看Python的那些错误代码，原来一开始那个屌丝把原始数据都给我整没了一些，因为长度不对，所以整不出结果。我要用Excel的公式实现某些功能，的确噼里啪啦有好多个方案。有些方案一看就直接可以忽略，因为又长又臭，另外一些我感觉有些希望的却发现到Excel里面同样也是出不了结果。至于为什么我也不去纠结了，我直接去研究这些方法的思路到底是什么。我让它用Power Query，也就是M语言给我实现某个功能，结果发现把那堆代码贴到高级编辑器，甚至都无法按确定提交，因为显示语法错误。那个编辑器是一个神经的存在，说语法错误，但定位的那个点实际上没有问题，但那个问题到底在哪里，你得人肉上下文去找。我使用的通常是对半检索法，首先留一半，然后一半的一半。理论上是这么找的，但实际上后面某些功能不要我觉得都无所谓，所以我只要找到那些我需要的就可以了。最终发现，某个用了函数的地方，理论上应该是“=>”。DS给我的代码是“->”。如果这份代码是由图片识别过来的，出现这种等号变成减号，我觉得可以理解，但显然这种事情怎么可能发生？！对一个什么都不懂的人来说，你叫他怎么可能人肉找得出这样的低级错误呢？！那个代码除了那个等号变成了减号以外，最后的结果还有一些无厘头的数据合并，那些数据在前面几个步骤里面已经不复存在了，在最后那个步骤又突然间被提起，真牛逼！

在这种情况下，说AI可以取代人类完成编程，我觉得起码暂时是不行的，尤其是要实现一些高度定制的功能的时候。

子痕
AI孙燕姿 2023年10月10日 23:23

AI孙燕姿

子痕

2023年10月10日 23:23

仿佛村里刚通网，以前只是听说AI孙燕姿，直到今天才去认真的找AI孙燕姿的歌。 Bilibili真是个宝，什么都 […]

伪医生律师
最伟大的变革——人工智能 2025年10月14日 09:56

最伟大的变革——人工智能

伪医生律师

陈大猫

2025年10月14日 09:56

如果说这个时代最伟大的变革是什么？

那一定是：人工智能。

2023年2月，我对大火的ChatGPT写了一篇简短的博文，谈了下自己的感受。

重点是，我在博文里对人工智能进行了美好的畅想：

什么时候人工智能会让我惊艳？

我觉得是直接将电影/电视剧本自动转换为影视成片。

或者说，通过人类语言控制电脑生成电影场景、人物，并指挥人物做出各种动作。

简而言之，这个功能/这种技术叫做：

文生视频。

当时，最厉害的大模型也只能做到：

文生图。

现在，经常冲浪的朋友就知道，文生视频早就遍地开花了。

特别是今年国庆期间OpenAI新推出的Sora2，它生成的视频更清晰、自然、复杂，音频和视频一致性达到极佳程度。

虽然我没有亲自体验到Sora2，但社交媒体上大量的生成效果视频已经惊艳到了我。

这段时间我重点体验了一下NONO banana、豆包这两个大模型的图片生成和编辑功能。

我的感受就是：

太他妈牛逼了！

有了这些大模型，生成各类创意图片，合成图片，简直不要太方便。

特别是任意合成自己与明星的合影，算是小小地意淫了一把，实现多年愿望。

最伟大的变革——人工智能

本博主与王心凌亲密合影

当然，目前这些大模型还有不少缺陷，比如，对参考图人物五官保持一致性方面还有点差，经常合成的图片人物面部都改变了，变得不像了。对复杂指令的理解、执行有偏差，对中文的处理经常会出BUG……

但，瑕不掩瑜。

我满怀信心，我们深处的这个时代一定是人工智能时代。

人工智能最大的作用并不是替代人类，而是作为人类更好的帮手。

品味苏州
hello，Mr.AI 2025年1月11日 23:40

hello，Mr.AI

品味苏州

扶苏

2025年1月11日 23:40

没想到新年第一个话题是AI，不算早也不算晚。之前关注AI的一些新闻，还是用审视科技进步的眼光再看，没想突然间AI就嗖的一下进入了日常生活。今天和老婆表姐一家人聊天，说起她还在读高中的女儿，已经在网上写“小作文”赚钱了。根据约稿人的要求，...

💾

破袜子
加量先生 2025年10月30日 08:55

加量先生

破袜子

大致

2025年10月30日 08:55

同事小玲的闺女上小学三年级。
某日，老师布置了一篇350字作文。
她闺女在家里憋了一晚上，只写出不到200字。
为了完成作业，小玲把这200字喂给AI，加了些余量，让AI给扩充成450字。
AI又给加了些余量，扩充成了500多字。
小玲闺女抄到下半夜，天亮交了。

过了几天，老师批改之后打了回来。
学校要求老师用AI批改，老师的AI把这篇作文扩充成了1000字出头，打印出来，让抄到作文本上。
小玲跟闺女拉扯了一晚上，死活不抄。
她只能等闺女睡觉以后，亲自抄到下半夜。

AI写，AI批，应该发明个AI抄写机器人。

《加量先生》采用署名-非商业性使用-禁止演绎许可协议进行许可。『破袜子』期待与您交流。

每夫吐槽（111）

破袜子

大致

2025年10月23日 15:08

小玲在家里饭桌上给她闺女讲我的故事：“妈妈单位有个大大，他家养了只守宫，结果不光要养守宫，还要养面包虫。想想都麻人。”
随后，她闺女就撒泼打滚要养守宫。
周五晚上就光速去宠物市场买了一只。
容不得她考虑麻人不麻人，而是人麻了。
这个故事告诉我们，在家里蛐蛐同事，会遭到要养蛐蛐的惩罚。

集团每年都会参加一个在线答题竞赛。今年特别强调要认真答，不能像往年一样瞎吉儿点，十几二十分的忒磕碜。
我们组不能用开发机上网，在工位的尽头有两台走公网的网吧机。所以谁跑去答题了是很明显的事。一开始还是简单的客套：“你答了多少分”，到后来莫名变成了一场暗自较劲的比拼。
答是不可能亲自答的，这个年代也不用自己搜答案了，实际上比的是谁用的AI更厉害。文心一言、星火、豆包、混元、盘古、deepseek、chatgpt，不一而足。
最终成绩最好的是豆包，100。成绩最差的也是豆包，72。
我用的是grok，84。

单位的鼠标坏了，左键连击。也懒得修，随便下单一个便宜的杂牌大手型无线鼠标。
东西一拿到就后悔了。
侧边键这傻叉玩意谁发明的？屁用没有尽添乱。然后因为便宜，还没有驱动，不能屏蔽。
找到的禁侧边键工具也不大好用，似乎是需要随系统启动，但是不是真的生效了要看运气，莫名其妙。

臭宝学校十一放假前的两天是运动会和艺术节。
起初班主任积极性很高，订了有印有slogan的班徽、班服和班旗。
班主任是教英语的，slogan引用的是托马斯·杰斐逊的关于少说多做的啥啥名言。
运动会开始前两天，校领导找班主任谈话：“这次运动会，市教育局的领导要来看，你们这个英文的口号就别用了，影响不好。班服穿就穿吧，那个旗千万不要打。”
是不是真严苛到这程度了，我不知道，但什么年代都不缺黄文炳。

臭宝的班主任人很和蔼，就缺了些威严，班上有些男生就不把他当回事。自习课讲话被走廊里的巡查领导抓了好几次。
班主任免不了挨训。
后来他终于决定杀鸡儆猴，停止了4个男生晚自习（19：30~20：50）资格一周。
于是他们班自习讲话的问题更严重了——这哪里是惩罚，分明是奖励啊！

注：夫=大姨夫。

《每夫吐槽（111）》采用署名-非商业性使用-禁止演绎许可协议进行许可。『破袜子』期待与您交流。

The End of Wonder

The Other Stuff

Jeff Cann

2025年6月30日 19:02

Remember 2022, the golden era of the internet? Back then, a reel popped up on my Instagram feed. Security footage captures a man sitting on a Target-ball in front of a store. Target-ball? You know what I mean, those large red concrete balls spaced in front of Target’s glass entryway. They make smash-and-grab rammings nearly impossible. In the footage, an out-of-control car slams into the ball next to where the man sits. The ball caroms into the ball beneath the man, knocks it away like a billiard ball, and the new ball stops directly under the man’s butt. One ball replaced the other. The man barely reacts. He probably doesn’t even know he’s sitting on a new ball yet.

“Whoa!” I watch it again and again. I can’t see any evidence that it’s fake. Convinced, I share it with my family. Real life is better than fiction. I love stuff like this. Loved! In 2022, I could watch it all day. That’s in the past now. Today, anything unbelievable is assumed to be AI.

Last week, I saw a video on Facebook. A grizzly draped itself over a car. It inadvertently pushed the car down the road as it tried to find a good angle to lick spilled food off the car hood. Realistic? Horns blared, the bear huffed, the car beneath the bear struggled under the added weight. Even the camera angle looked believable, as if the photographer tried to keep an extra car between themselves and the bear. Everything appears legit, but the bear is too big, even for a grizzly. It’s as big as the car.

I’ve seen a grizzly up close. The Cabela’s Sporting Goods in Hamburg, Pennsylvania has a taxidermized grizzly standing upright in their store. When my kids were young, we often stopped there for bathroom breaks as we drove to visit their grandparents. Cabela’s had the grizzly, a couple of elk and several huge aquariums filled with lake trout. It’s a nice break after a few hours in the car. The grizzly is massive. It’s unbelievable, frightening, awe inspiring, but it’s not as big as a car. Probably.

Here’s the thing. Maybe the grizzly video could be authentic. Maybe grizzlies actually grow that big. What do I know. I’m a city-guy from Washington, DC. But it no longer matters. I can’t tell the difference between real and fake. And if it isn’t real, what’s the point. The video isn’t exciting if Google Veo 3 thought it up. It’s impressive that AI has advanced so far since Chat GPT’s splashy release a couple of years ago, but it has ruined the magic of the unbelievable. It put an end to wonder.

Yesterday, the New York Times published a test. They posted ten short videos. Readers watched the videos and then guessed whether the content was genuine or AI generated. I got seven out of ten correct, but not because I could spot AI, the videos all looked real to me. I just used basic psychology. The more outlandish the video seemed, the less likely I was to call it AI. The most mundane videos, a guy livestreaming as he walked down a dirt road, two news anchors introducing themselves, those were fake. A whimsical clip of a model releasing balloons into the sky while flapping birds surround her, that one is real.

This is my question, my fear. Will I ever be stunned by a photograph again? A list of some of the greatest, most recognizable photos in history: Charles Ebbets – Lunch atop a Skyscraper; Nick Ut – Napalm Girl*; Alfred Eisenstaedt – V-J Day in Times Square; Steve McCurry – Afghan Girl. The next time a world-changing photograph is published, will we even know if it’s real? Will an artist capture a unique and beautiful (or terrible) moment in time, or will a clever app simply generate something sure to stir those idiotic humans who keep the electricity running.

As if to put an exclamation point on this thought, just before bed last night, I saw a tornado reel on Facebook. Tornados fascinate me. The raw, focused power makes the ‘finger of God’ analogy I’ve heard since childhood the most appropriate descriptor. The tornado in this video was a monster, ever approaching the camera as it tore a swath across the barren countryside. It’s exactly the sort of video I would watch repeatedly, mesmerized by the awful beauty of nature. Instead, I gave my head a quick shake swiped to watch Anatoly prank another room full of muscleheads. Hmmm, I wonder if that one was real. It’s much easier to create these videos on a computer than find a group of weightlifters who haven’t heard of Anatoly.

*The attribution of Napalm Girl is currently in dispute. World Press Photo has determined that it’s possible Nick Ut, did not shoot the photo. “’Visual and technical’ evidence ‘leans toward’ an emerging theory that a Vietnamese freelance photographer, Nguyen Thanh Nghe, took the photo.”

Image: Screenshot captured from Facebook

小赖子
用 Python 学强化学习: Q-Learning 迷宫示例 2025年11月12日 19:42

用 Python 学强化学习: Q-Learning 迷宫示例

小赖子

JustYY.com 小赖子的英国生活和资讯

2025年11月12日 19:42

[caption id="attachment_70386" align="alignnone" width="2017"] Q Learning强化学习算法(机器学习/人工智能)[/caption] 强化学习（Reinforcement Learning, RL）是一种让智能体/Agent通过与环境交互、试错学习来获得最优行为策略的机器学习方法。本文用一个简单的 Q-learning 迷宫示例，帮助你快速理解强化学习的基本原理。

强化学习入门：从试错中学习的艺术 Reinforcement Learning 101: The Art of Learning by Trial and Error 深度解析强化学习：Q-Learning算法详解 Deep Dive into Reinforcement Learning: Understanding the Q-Learning Algorithm 机器如何学会自己做决定？强化学习告诉你答案 How Do Machines Learn to Make Their Own Decisions? Reinforcement Learning Explained 从奖励中学习：人工智能的“试错智慧” Learning from Rewards: The Trial-and-Error Intelligence Behind AI

一、什么是强化学习？

强化学习的世界中包含五个关键要素：

Agent（智能体）：做决策、执行动作的主体
Environment（环境）：智能体所处的世界
State（状态）：当前环境的描述
Action（动作）：智能体可采取的操作
Reward（奖励）：环境反馈，用来衡量动作的好坏

智能体的目标是学习一个策略 π(a|s)，让它在每个状态下选择最优动作，从而获得最大的累积奖励。 [math]J(\pi) = \mathbb{E}\pi \left[ \sum{t=0}^{\infty} \gamma^t r_t \right][/math] 其中 [math]\gamma[/math]（0 ≤ [math]\gamma[/math] ≤ 1）是折扣因子，用于衡量未来奖励相对于即时奖励的重要程度。

二、Q-Learning 原理

Q-learning 是最经典的强化学习算法之一。它通过学习一个 Q 表（Q-table）来记录每个“状态-动作”对的价值。更新公式如下：


[math] Q(s,a) \leftarrow Q(s,a) + \alpha [r + \gamma \max_{a'} Q(s', a') - Q(s,a)] [/math]

其中：

[math] \alpha [/math]：学习率（Learning Rate）
[math] \gamma [/math]：折扣因子（Discount Factor）
[math] r [/math]：奖励（Reward）
[math] s' [/math]：下一状态（Next State）

三、迷宫环境设计

定义一个 3×5 的迷宫：

0：空地
-1：墙
1：出口（目标）

四、完整 Python 实现代码


import numpy as np
import random

# 1️⃣ 定义迷宫
maze = np.array([
    [0,  0,  0, -1,  1],
    [0, -1,  0, -1,  0],
    [0,  0,  0,  0,  0]
])

n_rows, n_cols = maze.shape
actions = ['up', 'down', 'left', 'right']
Q = np.zeros((n_rows, n_cols, len(actions)))

# 2️⃣ 超参数
alpha = 0.1
gamma = 0.9
epsilon = 0.1
episodes = 500

# 3️⃣ 辅助函数
def is_valid(state):
    r, c = state
    return 0 <= r < n_rows and 0 <= c < n_cols and maze[r, c] != -1

def next_state(state, action):
    r, c = state
    if action == 'up': r -= 1
    elif action == 'down': r += 1
    elif action == 'left': c -= 1
    elif action == 'right': c += 1
    return (r, c)

def get_reward(state):
    r, c = state
    if maze[r, c] == 1: return 10
    elif maze[r, c] == -1: return -1
    return -0.1

# 4️⃣ 训练循环
for episode in range(episodes):
    state = (2, 0)
    done = False

    while not done:
        if random.uniform(0, 1) < epsilon:
            action_idx = random.randint(0, len(actions)-1)
        else:
            action_idx = np.argmax(Q[state[0], state[1]])

        action = actions[action_idx]
        next_s = next_state(state, action)

        if not is_valid(next_s):
            reward = -1
            next_s = state
        else:
            reward = get_reward(next_s)

        Q[state[0], state[1], action_idx] += alpha * (
            reward + gamma * np.max(Q[next_s[0], next_s[1]]) - Q[state[0], state[1], action_idx]
        )

        state = next_s
        if maze[state[0], state[1]] == 1:
            done = True

print("✅ 训练完成！")

# 5️⃣ 查看学到的路径
state = (2, 0)
path = [state]

while maze[state[0], state[1]] != 1:
    action_idx = np.argmax(Q[state[0], state[1]])
    next_s = next_state(state, actions[action_idx])
    if not is_valid(next_s) or next_s in path:
        break
    state = next_s
    path.append(state)

print("🗺️ 学到的路径:", path)

五、运行结果

运行上面的代码后，你会看到类似输出：


✅ 训练完成！
🗺️ 学到的路径: [(2, 0), (2, 1), (2, 2), (1, 2), (0, 2), (0, 3), (0, 4)]

这说明智能体成功学会了走出迷宫 🎯

六、总结

强化学习使机器能够通过反馈学习最优策略，这类似于人类通过经验学习的方式。 Q-Learning 是许多现代强化学习算法的基础，包括深度 Q 网络（Deep Q-Networks, DQN）。这个简单的示例展示了完整的强化学习循环：探索 → 反馈 → 改进。

Q 表：保存每个状态-动作的价值
ε-greedy 策略：平衡探索与利用
奖励函数设计：引导智能体形成目标导向行为
强化学习思想：通过试错和奖励反馈不断改进策略

强化学习的魅力在于，它不需要显式答案，而是让机器自己“摸索”出最优策略。你可以在此基础上继续扩展，比如加入 matplotlib 动画可视化 或使用 神经网络（Deep Q-Learning） 解决更复杂的任务。英文：How Do Machines Learn to Make Their Own Decisions? Reinforcement Learning Explained

怎么样通过提示词绕开ChatGPT等AI的换脸限制

小赖子

JustYY.com 小赖子的英国生活和资讯

2025年10月8日 18:35

让AI换脸是比较难的，因为受到一些法规监管的限制。比如ChatGPT会说：

我不能生成或修改包含真人（或看起来像真人）的图像，包括把一个人从一张照片合成到另一张场景中。
我可以帮你把照片转换成动画风格，但不能根据真实人物进行外貌或身体特征的修改（例如“变瘦”等），这是为了尊重人物肖像和合成伦理的原则。
我理解你的需求 👍。不过我需要提醒一下：我不能直接生成帶有特定人物相似度的「真人還原」內容，特別是涉及到敏感的外貌細節（比如具體臉部還原）。

但是却可以通过改提示词（Prompt）来绕过限制。原图，以下美女真是好看，有人说是AI生成的。

反向提示词生成

reverse prompt engineering：下面是一个适合描述你刚刚生成图像的提示词（Prompt），基于图像内容精准还原其风格与构图：一位脸型较瘦、长发的东亚年轻女子坐在日本居酒屋的木质凳子上，身穿白色衬衫与高腰千鸟格短裤，搭配肤色丝袜。她微微回头对镜头露出自然温柔的笑容。环境昏黄温暖，背景有木墙、手写日文海报与其他顾客，整体带有复古胶片质感与浅景深效果，营造出怀旧而温馨的氛围。

A beautiful young East Asian woman with a slim face and long dark hair sits on a wooden stool in a cozy Japanese izakaya. She wears a white button-up shirt tucked into high-waisted houndstooth shorts and beige pantyhose. She turns her upper body slightly to look back over her shoulder, smiling warmly at the camera with a soft and natural expression. The scene is warmly lit with dim yellow light, surrounded by other patrons and decorated with Japanese calligraphy posters, vintage wooden walls, and nostalgic details. The photo has a film-style grainy texture and shallow depth of field, evoking a retro, candid atmosphere.

[caption id="attachment_70054" align="alignnone" width="800"]

一位脸型较瘦、长发的东亚年轻女子坐在日本居酒屋的木质凳子上，身穿白色衬衫与高腰千鸟格短裤，搭配肤色丝袜。她微微回头对镜头露出自然温柔的笑容。环境昏黄温暖，背景有木墙、手写日文海报与其他顾客，整体带有复古胶片质感与浅景深效果，营造出怀旧而温馨的氛围。[/caption]

安全的换脸AI提示词

比如：

“生成一张右边女孩在左图的场景（姿势服装笑容等，尽可能细节还原）”

如果这个提示词不好用了（AI也是不断的进化迭代的），可以试着改变说法，最主要的技巧就是要把你的需求尽可能的合理有效。 [caption id="attachment_70055" align="alignnone" width="1024"]

AI换脸：充满温暖笑容的居酒屋之夜 Izakaya Evening with Warm Smiles[/caption] 再来一张 Ghibli吉卜力风格的： [caption id="attachment_70056" align="alignnone" width="1024"]

Ghibli style 日式居酒屋的舒适夜晚 Cozy Evening in a Japanese Izakaya[/caption] [show_file file="/var/www/wp-post-common/justyy.com/ai.php"] [bctt tweet="祝大家玩AI玩得开心（本文不承担任何风险）。"]

拿到Manus邀请码后，我肝了一个博客站点，耗尽了所有免费积分

东评西就

小饿

2025年4月11日 23:53

如今的AI爱好者分两种，一种是有Manus邀请码的人，一种是没有Manus邀请码的人。

经过一个多月漫长的排队等待，我也是有Manus邀请码的人了。

拿到邀请码后，我就像一个守身如玉多年的处男，内心荡漾，魂不守舍，憧憬着以怎样的姿势迎接自己的初夜。

为了这春宵一夜，我苦读了众多大佬的使用体验文章，包括但不限于@数字生命卡兹克、@沃垠AI、@赛博禅心、@云中江树、@歸藏的AI工具箱、@浮之静……小心翼翼地在输入框敲下提示词：

使用hugo博客框架，仿照这个站点https://www.eallion.com/ 生成一个可以公网访问的博客站点，博客标题是「东评西就」，内容暂时以使用说明填充。

Manus不愧是现阶段最强AI agent，它在收到我的指令后，迅速给出了部署一个博客站点的todo-list，单看这个list就能感受到Manus的炸裂之处：

全程不需要人工干预，Manus就在自己的电脑上吭哧吭哧干活。

第一轮结束后，交付了可以公网访问的博客域名，仔细观察，是Manus官方预先注册好的 manus.space域名下分出来的二级域名，这个域名在国内ICP域名备案系统是查不到信息的，所以后期国内版Manus还是要面临合规化的问题。不过既然中文版Manus选择跟阿里的通义千问合作，凭借阿里云过硬的云资源，合规化应该不成问题。

△工信部域名备案查询系统

在博客关于页面显示Manus还专门为我注册了一个Github账号，访问链接后页面不存在，推测部署博客的代码仓库应该不是在Github上。

这一轮的交付没有显示导航栏，在第二轮提交提示词后，Manus接收了需求，还有板有眼解释了一下，告诉我可以通过链接直接访问各版块页面，这也太像偷懒的人类了。直到最后我的积分耗完，Manus也没能把这个问题解决，这可以说是Manus推理模型的局限性吧。

△博客首页界面

△反馈首页看不到导航栏

△归档页面

△分类页面

△关于页面

值得点赞的是，在最开始提示词中只提及文章示例可以放博客使用说明的相关内容，Manus自己还给我额外生成了两篇示例文章，一篇是关于中西方文化差异与融合的，另一篇是生活随笔。Manus大概是从我的博客名字「东评西就」推测出这个博客的内容主题，虽然并没有真正get到我的定位，但这种发挥主观能动性的服务意识，还是值得点赞的。

△Manus主动生成的博客文章示例

最后这个博客还缺少评论模块，把目前自己的博客站点评论模块的 envId和twikoo管理面板密码喂给了Manus，Manus像模像样在自己的电脑上吭哧了半天，最后也没能成功显示评论模块界面。

正当我准备试着让Manus以游客身份提交一条评论的时候，系统提醒我「你的余额不足，无法继续」。

真是意犹未尽+意难平啊。

好在Manus的交付物里有可以公网访问的域名链接，并且支持全站代码打包下载。我把代码下载到本地，在VScode里能正常运行。

分享一下Manus生成的博客站点：
首页：https://uzbbduol.manus.space
博客页面：https://uzbbduol.manus.space/blog/
归档页面：https://uzbbduol.manus.space/archives/
页面标签：https://uzbbduol.manus.space/tags/
分类页面：https://uzbbduol.manus.space/categories/
关于：https://uzbbduol.manus.space/about/

总结一下：

Manus熟悉博客站点开发的全流程，能够交付可以公网访问的域名链接。
Manus官方为用户开发需要，大概率准备了足够多的前置资源，比如储存空间（是否调用Github还不太清楚）、二级域名等等。这也从侧面反映出Manus会员的定价策略，但还是有些简单粗暴，我生成一个简单的hugo博客就耗费完所有积分，hugo博客的搭建本来就属于重复造轮子，不需要太多的推理，希望Manus在后期的版本能优化对积分的使用策略。
Manus能够根据用户的需求自行发挥，具有一定的发散思维。
对于项目始终没能显示导航栏，我的一个猜测，Manus对屏幕的识别能力还有些欠缺，并不能做到跟人眼一样的精准，它解释可能跟设置有关，估计就没识别出页面到底有没有导航栏，只是为了迎合人类的提问而已。

瓦解
AI 开发的导航页——SimpleNav 2025年11月14日 22:30

AI 开发的导航页——SimpleNav

瓦解

w4j1e

2025年11月14日 22:30

前言

在此之前，我用过好几年的 weTab 插件，自定义程度很高，小组件也很丰富。这几年，我见证了 weTab 从一个简单的导航页渐渐做大做强，而我的首页超链接这几年几乎都没怎么变过，这也足以说明导航页对我而言并非刚需，也确实大多数时候我访问网站都是依赖浏览器的自动补全。话虽如此，在 weTab 每次打开浏览器就开始同步导致我的老电脑要卡死好一会开始，我就决心自己做个导航页了。

我的wetab首页

说干就干！今年七月份我在 github 上传了第一个版本——当然，是由 AI 写的。一开始想做成一个动态页面，但又不愿折腾数据库，所以干脆把我常用的链接写死成了一个完全的静态页面，仅仅壁纸由必应日图的 api 负责每天更换。

第一个纯静态版本

上周，我和 inkss 说了我的计划，想找一个好用又好看的开源项目改一改部署在 edgeone pages，他也有些兴致，但是我们都没有找到更好的方案。于是我提到七月份写的那个导航页项目，在他有事搁浅了之后，我每天抽闲暇时间用 AI 继续改写，本文就简要记述一下这一件事。

CodeBuddy

由于我的编程经验并不丰富，加上 VS code 上只有一个 codebuddy 插件，所以一开始的任务都是交给它的。需求是：把这个纯静态页改成 next.js 项目，使用 onedrive 登陆和同步数据，以便后续直接在前端管理，也无需后台和数据库。

codebuddy 很快就完成了项目重构，并且根据代码和实现功能写了第一版 README，网页可以正常跑起来了，但我没想到需要折腾修改的大量工作还在后面。

next.js的第一个版本

一开始在本地开发，测试没有发现什么问题。推送到 github 由 EO pages 拉取部署，我也在 EO 添加了对应的环境变量，而遇到的问题包括但不限于（npm run dev 和 npm run build 居然有这么大的差别）：

① TypeScript编译错误，代码中尝试直接展开（...）一个 Set 集合，但当前的TypeScript编译配置不支持这种操作；

解决方式：将编译目标设置为支持ES2015（即ES6）及以上的环境。

② Next.js 应用路由没有正确设置成动态，Next.js 14 默认会尝试静态化所有路由，包括 API 路由，这就导致无法正常登陆 onedrive 服务；

解决方式：在必要的 api 路由中添加代码强制动态渲染。

export const dynamic = 'force-dynamic';

③ 开发环境和生产环境混淆，在开发环境中使用的回调地址是 localhost，在生产环境中依然如此而不是我的域名；

解决方案：使用环境变量动态设置重定向 URI。

④ 登陆失败，在前端使用微软账户登陆，跳转回来后页面依然是未登陆状态。

解决方式：让 AI 在多个断点打 log，当然 codebuddy 也自作聪明地写了两个 debug 页面，以便输出更多调试信息。

debug页面给出了很详细的信息

但也正是因为这个调试信息，我发现 requestURL 依然是 localhost 而不是我当前使用的域名，于是围绕这个问题我和 codebuddy 改了多次。由于本地环境测试没有任何问题，所以我一度怀疑是 EO pages 的策略有问题。

腾讯云技术排查后，告诉我应该还是代码的问题，云平台是没问题的。我仔细查看更详细的 debug 页面内容和网络请求，发现登陆后确实正确回传了认证信息，而网页没有能够获取到这一点。

继续和 Codebuddy 多次斡旋，最后我终于忍受不了它时不时显示“模型参数错误”这类的提醒，修改代码时陷入死循环，决定再换回 trae 试试。

trae

trae 是字节跳动开发的一款 IDE，上一次用还是七月份，彼时的豆包大模型常常给我的代码重复写几千行相同的内容，我就卸载了它。

再次换回 trae，居然发现它比 codebuddy 好用太多，它好像更能理解我的表述，分析代码的逻辑性也更强，修改一处代码后也会记得同时修改受到影响的其它模块。一开始它在修改代码后会在本地启用 npm run dev，但是它会开多个终端，然后发现端口一直被占用，后来就不用开发模式，而是直接在本地构建 npm run build，终端有报错的话它还会再次修改代码。

trae会很有条理地解决问题

在 trae 的帮助下，我不断修复遇到的各种 bug ——用 AI 写代码就会面临这样的问题，要多次调试和修复。我的 github 仓库里最近的提交几乎全是修复 bug 的。

用 trae 后，这个导航页终于基本可以正常使用了。

电影日历卡片

设置界面

SimpleNav

说起来是“简单”导航，但是我挺想实现还未实现的功能又挺复杂，比如在首页增加天气、热搜和电影推荐小组件，也想像 weTab 那样可以整一个在线的 TODO 小组件之类的玩意。但是我时间有限，尤其是最近超级忙，所以只能往后面再拖延了。

项目地址：W4J1e/SimpleNav: 这是一个简洁的自用导航页。

体验地址：SimpleNav

功能特点

🎨 美观的界面设计：支持多种背景类型（纯色、图片、渐变、Bing每日一图、本地上传）
🌅 自动更新壁纸：支持自动获取并更新Bing每日一图作为背景
🔍 集成搜索功能：目前只支持必应
📱 响应式设计：适配各种设备屏幕
🗂️ 分类管理：支持链接分类和筛选
🌙 主题切换：支持明暗主题切换
☁️ 云同步：支持OneDrive云同步功能
📤 数据导入导出：支持 json 格式的数据的备份和恢复
🖼️ 图标选择：支持Font Awesome图标或网站favicon
🔥 小组件集成：目前支持知乎热榜、电影日历和待办事项
📌 卡片拖动排序：支持所有卡片的自由拖动排序

基本使用

添加链接：点击页面中的”+”按钮，填写链接信息
编辑链接：右键点击链接卡片可以编辑或删除链接
分类筛选：点击顶部的分类标签进行筛选
搜索功能：使用搜索框进行网络搜索
设置页面：点击页脚的”设置”按钮登陆 onedrive 以同步、设置网页背景和数据导入导出
卡片位置：长按卡片可以拖动调整位置

自部署

目前支持大多数无服务平台的部署，可以 folk 我的仓库，连接到 vercel 或者 EO pages 之类的平台，选择 nextJS 项目进行部署。

需要配置以下环境变量：

AZURE_CLIENT_ID=your_azure_client_id

AZURE_CLIENT_SECRET=your_azure_client_secret

AZURE_TENANT_ID=your_azure_tenant_id

AZURE_REDIRECT_URI=https://yourdomain.com/api/auth/callback

JWT_SECRET=your_jwt_secret_key

详情可以参考部署文档。

写在最后

AI 编程的兴起，让我这种基本不会编程的人也可以更高效地完成一些小打小闹的项目，这真是个伟大的时代！但是这个过程中我每一次都更清晰地意识到，打铁还需自身硬，如果完全依赖 AI 去修复 bug，自己没有技术实力，会走很多弯路。

子痕
Edge浏览器升级了AI 2025年9月9日 09:46

Edge浏览器升级了AI

子痕

2025年9月9日 09:46

前几天才惊讶于Dia的AI浏览器，这两天Edge浏览器也升级了AI，可以直接读取浏览器里的内容，然后整理总结。

Edge浏览器140.0.3485.54版Copilot现在搭载了GPT-，可以根据任务需求自动切换为“深度思考”或“快速响应”模式。用户只需在聊天模式下拉菜单中选择“智能”选项即可体验。

先体验几天看看。

Edge Copilot GPT-5

CloseX
How to use Universal Robot MCP, a step by step tutorial 2025年9月23日 16:40

How to use Universal Robot MCP, a step by step tutorial

CloseX

One

2025年9月23日 16:40

Master Universal Robot MCP server integration with this step-by-step tutorial. Learn installation methods, robot connection management, real-time status monitoring, joint and linear motion control, safety protocols, and simulation mode. Perfect for developers wanting to enable AI assistants to control Universal Robots through the Model Context Protocol interface.

CloseX
Run Claude Code and Set Up Claude Code Router in Termux(Android) 2025年7月29日 00:00

Run Claude Code and Set Up Claude Code Router in Termux(Android)

CloseX

One

2025年7月29日 00:00

Learn how to install and run Claude Code in Termux on Android, and seamlessly configure Claude Code Router to flexibly switch AI models for coding tasks. This tutorial covers setup, configuration, and practical tips for boosting development productivity with a powerful, customizable AI coding environment on your mobile device.

Kaffa.im
大话机器智能 2024年8月7日 11:43

大话机器智能

Kaffa.im

Kaffa

2024年8月7日 11:43

评分

⭐⭐⭐⭐⭐ ⭐ 6 / 10

AI融入生活的两点想法

Kaffa.im

Kaffa

2024年8月1日 13:55

如半年前预料的，流量入口从互联网搜索正转向AI提问。

现在有疑问时，无论是技术领域或者生活领域的我都趋向于提问AI，我爸也是，但他那辈人还没有形成我一样的习惯。

Tombstones 是啥

为修改任务栏上的图标名称，我进入了下面的目录:

C:\Users\kaffa\AppData\Roaming\Microsoft\Internet Explorer\Quick Launch\User Pinned\TaskBar

在此目录中，我发现了一个叫做 Tombstones 的目录，Tombstones 是墓碑石，许多国人会觉得晦气。

为弄清楚 Tombstones 是个啥，我特地询问了豆包、通义千问、腾讯元宝、ChatGPT，结果出现了三种答案。

经过搜索的确认，我趋向于考虑它是一种 Windows 机制。

这里想说明的是，这个问题并不是一个靠逻辑推理可以猜测的问题，而是取决于领域知识，也许是 Windows 是微软的，但在回答中，只有 ChatGPT 的回答是肯定且确切的。通义千问的回答也还可以接受，但豆包和腾讯元宝就差点意思。

VOKEN 是啥

我爸给我发了一块手表的图片，他问我这是什么手表，经过识别，我发现了 VOKEN 品牌文字。

通过对豆包、通义千问、腾讯元宝、ChatGPT 的询问，也还是 ChatGPT 靠谱。

这说明了什么

经过上面两个例子，涉及到知道不知道的问题时，ChatGPT 占优势；豆包比较弱，通义千问、腾讯元宝也不强。但在使用体验上，豆包是一流的，日常随便问问时，我还是使用豆包较多。

这两个例子虽然不具有代表性，但能说明我和我爸使用 AI 的习惯。

用户习惯正从搜索转向 AI。在效果差不多时，不一定使用最强的，也许会使用顺手的 AI。
虽然老年人使用 AI 了，但 AI 自以为是的回答问题还是没解决，对于使用 AI 的老年人来说难以理解。

CloseX
Suno AI v3 Revolutionizes Music Creation with AI 2024年3月24日 00:50

Suno AI v3 Revolutionizes Music Creation with AI

CloseX

One

2024年3月24日 00:50

Suno AI has launched its version 3 (v3), marking a significant upgrade that enables the creation of radio-quality music in a matter of seconds.

普通视图

前言

选择

选择项目

选择接口

开改

精简代码

添加翻译器

修改

最后

相关推荐:

相关推荐:

一、什么是强化学习？

二、Q-Learning 原理

三、迷宫环境设计

四、完整 Python 实现代码

五、运行结果

六、总结

相关文章：

反向提示词生成

安全的换脸AI提示词

相关文章：

总结一下：

前言

CodeBuddy

trae

SimpleNav

功能特点

基本使用

自部署

写在最后

评分

评论

Tombstones 是啥

VOKEN 是啥

这说明了什么