普通视图

不知道吃什么,那就吃肯德基

2025年12月7日 23:10

不知道吃什么,那就吃肯德基 - 第1张图片

和往月一样,今天加班,中午点外卖吃得挺饱,下午也吃了一点零食,六点多下班时肚子并没有太饿,本想直接回去,又担心晚上会饿,思来想去不知道吃什么合适,最后奔向了公司附近新开的一家肯德基。

不知道吃什么,那就吃肯德基

在我小时候的印象里,汉堡叫做汉堡包,搭配薯条、炸鸡、可乐,这也是我对老家本土品牌“欢乐季”最深远的记忆。每到周五,就会有工作人员在学校门口派发传单,四四方方的纸片上印着各种口味的汉堡、炸鸡、饮品,标注着价格,可以将其剪下,凭此以优惠价格购买。小时候收集了很多,但一次都没有用过。那时候一个汉堡、一份薯条,价格昂贵,家人也没有带我去过,每每路过,都会留下羡慕的眼神,尤其是看到有人生日,一家人在店里戴着生日帽、吹着蜡烛、吃着汉堡,更加羡慕。

长大以后,了解了肯德基、麦当劳,以及现在的塔斯汀,价格虽然没有特别便宜,但这却是上班族较为实惠的选择。人终究会为年少不可得之物困其一生,汉堡、薯条即是如此,遇上疯狂星期四,如果下班早,恰好当天有想吃的餐品,毫不犹豫奔向肯德基;周末在外面,到饭点,麦当劳和肯德基是我认为一人食的最佳选择。吮指原味鸡、热辣香骨鸡、蜜汁全鸡,经典的香辣鸡腿堡、老北京鸡肉卷,只要稍微回忆一下,便能想起它们的味道。

有一份专属工作日的 OK 三件套只需要 19.9 元,任选 1 份黄金 SPA 鸡排堡或者滋滋 YES 烤鸡腿堡,加一份劲爆鸡米花和中可,对于我来说,中午或晚上来上一份,就能吃饱。

陈仓颉在《麦门永存。》中提到肯德基更像是一个卖一些西餐的中餐厅,不仅有豆浆、烧饼、油条、茶叶蛋,今天看菜单,还有炸串、鸡架,越来越贴近中国人的饮食习惯和口味。在使用闲鱼下单肯德基之后,我更加确定了“不知道吃什么,那就吃肯德基”的合理性(ps:肯德基替换成麦当劳或其他品牌也适用)。一份香辣鸡腿堡,一杯中可,在闲鱼上代下单,不到 14 元,十分满意,本想放出截图,怕有广告嫌疑,遂作罢。

不知道吃什么,那就吃肯德基 - 第2张图片

大学时期,学校门口便有一家肯德基,每到疯狂星期四,除了在朋友圈和微信群发一发V我 50 的段子,也会拉上室友参与一番,我点热辣香骨鸡,你点黄金鸡块,如此疯狂,如此惬意。毕业后,工作了,每周依然有疯狂星期四,但我们都不再疯狂,仅仅只为了犒劳工作一天的自己,填饱肚子。

不知道吃什么,那就吃肯德基》最先出现在印记

VPS“融合怪”脚本实测CloudCone

2025年12月7日 22:24

上周,在《特惠VPS突遭强制清退》一文的评论中,友博“大致”问我最终决定买了哪家的 VPS,我回复是购买了 CC 家:刚好在"网络星期一" (Cyber Monday),CloudCone 推出一款相对低价的套餐 CM-25-VPS-1,年付9.99美元,性价比不错,可惜当前已售罄。

CM-25-VPS-1 套餐详情:

1 vCPU Core
1 GB Dedicated RAM
50 GB of SSD Cached Disk
On RAID-10 Configuration
1 TB/Mo Bandwidth at 1 Gb/s
1x IPv4 and 3x IPv6

Datacenter: DC1, Los Angeles, USA
Lifetime Recurring Offer

下单并付款,稍等片刻机器已开通。运气不错,VPS 盲盒开出【 74.48.*.* 】IP段,根据网友反馈,该IP段可以完美解锁美区的各项跨国服务。另外,还可以在后台自助免费开通三个 IPv6 地址。

CloudCone

近日,了解到不少 VPS 爱好者使用一款名为“融合怪”的VPS服务器测评脚本。已整合诸多第三方测试脚本进行优化融合,一条命令搞定 VPS 基础信息、CPU测试、内存硬盘跑分、流媒体解锁测试、IP质量/安全信息查询、邮件端口测试、上游及回程路由线路检测、三网路由测试、网速测试及三网 Ping 值测试等项目。

刚好,我就“融合怪”脚本来测试新购买的 CloudCone 的 VPS——

项目地址:VPS融合怪服务器测评项目 GO版本 https://github.com/oneclickvirt/ecs
export noninteractive=true && curl -L https://raw.githubusercontent.com/oneclickvirt/ecs/master/goecs.sh -o goecs.sh && chmod +x goecs.sh && ./goecs.sh install && goecs #针对海外服务器-无加速
export noninteractive=true && curl -L https://cdn.spiritlhl.net/https://raw.githubusercontent.com/oneclickvirt/ecs/master/goecs.sh -o goecs.sh && chmod +x goecs.sh && ./goecs.sh install && goecs #针对国际/国内服务器-带CDN加速

VPS融合怪服务器测评项目 GO版本


系统基础信息/CPU测试/内存测试/硬盘测试

硬件很一般,有过度超售之嫌疑,不适合作为建站机。非纯 SSD ,而是固态缓存的机械硬盘,网友们戏称 CloudCone 的硬盘为“石头盘”。

--------------------------------------系统基础信息--------------------------------------
 CPU 型号: Intel(R) Xeon(R) CPU E5-2697 v2 @ 2.70GHz
 CPU 数量: 1 Virtual CPU(s)
 CPU 缓存: L1: 64 KB / L2: 256 KB / L3: 30 MB
 GPU 型号: GD 5446
 AES-NI  :  Enabled
 VM-x/AMD-V/Hyper-V  :  Enabled
 内存 : 312.29 MB / 969.46 MB
 气球驱动:  Undetected
 内核页合并: Undetected
 虚拟内存 Swap: 0.00 MB / 1022.98 MB
 硬盘空间: 3.60 GB / 48.14 GB [7.5%%] /dev/vda1 - /
 启动盘路径: /dev/vda1
 系统 : ubuntu 22.04 [x86_64] 
 内核 : 5.15.0-46-generic
 系统在线时间  : 0 days, 00 hours, 03 minutes
 时区 : UTC
 负载 : 0.04 / 0.07 / 0.03
 虚拟化架构: KVM
 NAT类型 : Full Cone
 TCP加速方式: cubic
 IPV4 ASN: AS35916 MULTA-ASN1
 IPV4 Location : Los Angeles / California / United States
 IPV6 ASN: AS35916 MULTA-ASN1
 IPV6 Location : Los Angeles / California / United States
 IPv6 子网掩码 : /64
--------------------------------CPU测试-通过sysbench测试--------------------------------
1 线程测试(单核)得分: 477.95
---------------------------------内存测试-通过stream测试----------------------------------
Function     Best Rate MB/s     Avg time     Min time     Max time
Copy:6522.3     0.025541          0.024531     0.025913
Scale:10056.6   0.016271          0.015910     0.016894
Add: 9918.2     0.025001          0.024198     0.028126
Triad:10232.4   0.024645          0.023455     0.026655
-----------------------------------硬盘测试-通过fio测试-----------------------------------
测试路径块大小         读测试(IOPS)       写测试(IOPS)           总和(IOPS)
/root 4k           3.51 MB/s(877)    3.54 MB/s(884)     7.05 MB/s(1761)  
/root 64k          58.58 MB/s(915)   59.12 MB/s(923)    117.69 MB/s(1838)
/root 512k         155.46 MB/s(303)  163.72 MB/s(319)   319.18 MB/s(622) 
/root 1m           156.24 MB/s(152)  166.65 MB/s(162)   322.89 MB/s(314)

跨国平台解锁/IP质量检测

这个IP段不错,能解锁 Netflix 、Disney+、Spotify、ChatGPT、Sora、Gemini等几乎所有美国主流流媒体和AI服务网站。

--------------------------------------跨国平台解锁--------------------------------------
IPV4:
============[ 跨国平台 ]============
Apple:YES (Region: USA)
BingSearch:YES (Region: US)
Claude: YES
Dazn: YES (Region: US)
Disney+:YES (Region: US)
Gemini:YES (Region: US)
GoogleSearch:YES
Google Play Store:YES (Region: US)
IQiYi:YES (Region: US)
Instagram Licensed Audio:YES
KOCOWA:YES
MetaAI:NO (GeoBlocked)
Netflix:YES (Region: US)
Netflix CDN:US
OneTrust:YES (Region: US CALIFORNIA)
ChatGPT: YES (Region: US)
Paramount+:YES
Amazon Prime Video:YES (Region: US)
Reddit: YES
SonyLiv:YES (Region: US)
Sora: YES (Region: US)
Spotify Registration:YES (Region: US)
Steam Store:YES (Community Available) (Region: US)
TVBAnywhere+:YES (Region: US)
TikTok:YES (Region: US)
Viu.com:YES
Wikipedia Editability:YES
YouTube Region:YES
YouTube CDN:LAX
--------------------------------------IP质量检测--------------------------------------
以下为各数据库编号,输出结果后将自带数据库来源对应的编号
ipinfo数据库  [0] | scamalytics数据库 [1] | virustotal数据库   [2] | abuseipdb数据库   [3] | ip2location数据库    [4]
ip-api数据库  [5] | ipwhois数据库     [6] | ipregistry数据库   [7] | ipdata数据库      [8] | db-ip数据库          [9]
ipapiis数据库 [A] | ipapicom数据库    [B] | bigdatacloud数据库 [C] | dkly数据库        [D] | ipqualityscore数据库 [E]
ipintel数据库 [F] | ipfighter数据库   [G] | fraudlogix数据库   [H] | cloudflare数据库  [I] |

IPV4:
安全得分:
信任得分(越高越好): 0 [8] 
VPN得分(越低越好): 100 [8] 
代理得分(越低越好): 100 [8] 
社区投票-无害: 0 [2] 
社区投票-恶意: 0 [2] 
威胁得分(越低越好): 100 [8] 
欺诈得分(越低越好): 84 [E] 
滥用得分(越低越好): 0 [3] 
ASN滥用得分(越低越好): 0.0013 (Low) [A] 
公司滥用得分(越低越好): 0 (Very Low) [A] 
威胁级别: low [9] 
流量占比: 真人(越高越好)22% [I] 机器人(越低越好)77% [I]
黑名单记录统计:(有多少黑名单网站有记录):
无害记录数: 0 [2]  恶意记录数: 0 [2]  可疑记录数: 0 [2]  无记录数: 95 [2] 

安全信息:
使用类型: business [8 9] isp [A] hosting [0 3 7 C]
公司类型: hosting [0 7] isp [A]
浏览器类型: 主流71% 其他28% [I] 
设备类型: 桌面55% 移动44% 其他0% [I] 
操作系统类型: 主流92% 其他7% [I] 
是否云提供商: Yes [7] 
是否数据中心: No [6 8 A] Yes [0 5 C G]
是否移动设备: No [5 A C G] Yes [E]
是否代理: No [0 4 5 6 7 8 9 A C] Yes [E G]
是否VPN: Yes [E G] No [0 6 7 A C]
是否TorExit: No [7] 
是否Tor出口: No [7] 
是否网络爬虫: No [9 A E] 
是否匿名: No [6 7] Yes [8]
是否攻击者: No [7 8] 
是否滥用者: No [7 8 A C E] 
是否威胁: No [7 8 C] 
是否中继: No [0 7 8 C] 
是否Bogon: No [7 8 A C] 
是否机器人: No [E] 
DNS-黑名单: 314(Total_Check) 0(Clean) 0(Blacklisted) 0(Other) 

IPV6:
安全得分:
滥用得分(越低越好): 0 [3] 
ASN滥用得分(越低越好): 0.0013 (Low) [A] 
公司滥用得分(越低越好): 0 (Very Low) [A] 
流量占比: 真人(越高越好)22% [I] 机器人(越低越好)77% [I]
安全信息:
使用类型: hosting [3] isp [A]
公司类型: isp [A] 
浏览器类型: 主流71% 其他28% [I] 
设备类型: 桌面55% 移动44% 其他0% [I] 
操作系统类型: 主流92% 其他7% [I]
是否数据中心: No [A] Yes [G]
是否移动设备: No [A G] 
是否代理: No [A] Yes [G]
是否VPN: Yes [G] No [A]
是否Tor: No [3 A] 
是否网络爬虫: No [A] 
是否滥用者: No [A] 
是否Bogon: No [A] 
DNS-黑名单: 314(Total_Check) 0(Clean) 0(Blacklisted) 314(Other)

上游及回程线路检测/三网回程路由检测/PING值检测/就近节点测速

尤其在晚上8-11点晚高峰期间,访问速度不错,比我之前使用的俄罗斯的 VPS 延迟更高、但速度反而更快!

------------------------------------上游及回程线路检测-------------------------------------
      AS174             AS2914            AS6939      
      Cogent             NTT        Hurricane Electric
   Tier1 Global      Tier1 Global         Tier2      
 
北京电信v4 219.141.140.10           电信163    [普通线路] 
北京联通v4 202.106.195.68           联通4837   [普通线路] 
北京移动v4 221.179.155.161          移动CMI    [普通线路] 
上海电信v4 202.96.209.133           电信163    [普通线路] 
上海联通v4 210.22.97.1              联通4837   [普通线路] 
上海移动v4 211.136.112.200          移动CMI    [普通线路] 
广州电信v4 58.60.188.222            电信163    [普通线路] 
广州联通v4 210.21.196.6    检测不到回程路由节点的IPV4地址
广州移动v4 120.196.165.24           移动CMI    [普通线路] 
成都电信v4 61.139.2.69              电信163    [普通线路] 
成都联通v4 119.6.6.6                联通4837   [普通线路] 
成都移动v4 211.137.96.205           移动CMI    [普通线路] 
北京电信v6 2400:89c0:1053:3::69     电信163    [普通线路] 
北京联通v6 2400:89c0:1013:3::54     联通4837   [普通线路] 
北京移动v6 2409:8c00:8421:1303::55  移动CMIN2  [精品线路] 移动CMI    [普通线路] 
上海电信v6 240e:e1:aa00:4000::24    电信163    [普通线路] 
上海联通v6 2408:80f1:21:5003::a     联通4837   [普通线路] 
上海移动v6 2409:8c1e:75b0:3003::26  移动CMI    [普通线路] 
广州电信v6 240e:97c:2f:3000::44     电信163    [普通线路] 
广州联通v6 2408:8756:f50:1001::c    联通4837   [普通线路] 
广州移动v6 2409:8c54:871:1001::12   移动CMIN2  [精品线路] 移动CMI    [普通线路] 
准确线路自行查看详细路由,本测试结果仅作参考
同一目标地址多个线路时,检测可能已越过汇聚层,除第一个线路外,后续信息可能无效

-------------------------------------三网回程路由检测-------------------------------------
[NextTrace API] preferred API IP - 104.26.13.151 - 209.01ms - Misaka.BER

广州电信 - ICMP v4 - traceroute to 58.60.188.222, 30 hops max, 52 byte packets
1.00 ms      AS35916    *                  美国, 加利福尼亚, 洛杉矶, multacom.com 
2.37 ms      AS35916    *                  美国, 加利福尼亚, 洛杉矶, multacom.com 
3.72 ms      AS2914     [NTTA-128]         美国, 加利福尼亚, 洛杉矶, gin.ntt.net 
1.04 ms      AS2914     [NTT-BACKBONE]     美国, 加利福尼亚, 洛杉矶, gin.ntt.net 
10.54 ms     AS2914     [NTT-BACKBONE]     美国, 加利福尼亚, 圣何塞, gin.ntt.net 
9.09 ms      AS2914     [NTT-BACKBONE]     美国, 加利福尼亚, 圣何塞, gin.ntt.net 
14.56 ms     AS4134     [CHINANET-US]      美国, 加利福尼亚, 圣克拉拉, chinatelecom.com.cn  电信
155.71 ms    AS4134     [CHINANET-BB]      中国, 广东, 广州, chinatelecom.com.cn 
157.08 ms    AS4134     [CHINANET-BB]      中国, 广东, 广州, chinatelecom.com.cn  电信
*
167.34 ms    AS134774   [CHINANET-GD]      中国, 广东, 深圳, chinatelecom.cn  电信
*

广州联通 - ICMP v4 - traceroute to 210.21.196.6, 30 hops max, 52 byte packets
1.05 ms      AS35916    *                  美国, 加利福尼亚, 洛杉矶, multacom.com 
1.03 ms      AS35916    *                  美国, 加利福尼亚, 洛杉矶, multacom.com 
3.26 ms      AS2914     [NTTA-128]         美国, 加利福尼亚, 洛杉矶, gin.ntt.net 
1.35 ms      AS2914     [NTT-BACKBONE]     美国, 加利福尼亚, 洛杉矶, gin.ntt.net 
1.16 ms      AS2914     [NTT-BACKBONE]     美国, 加利福尼亚, 洛杉矶, gin.ntt.net 
0.88 ms      AS701      [UU-152]           美国, 加利福尼亚, 洛杉矶, verizon.com 
0.83 ms      *          [NSFNET-T3]        美国, 加利福尼亚, 洛杉矶
198.77 ms    AS701      [UU-152]           美国, 加利福尼亚, 洛杉矶, verizon.com 
188.23 ms    AS4837     [CU169-BACKBONE]   中国, 广东, 广州, chinaunicom.cn  联通
189.50 ms    AS4837     [CU169-BACKBONE]   中国, 广东, 广州, chinaunicom.cn  联通
*
176.67 ms    AS17623    [APNIC-AP]         中国, 广东, 深圳, chinaunicom.cn  联通
166.67 ms    AS17623    *                  中国, 广东, 深圳, chinaunicom.cn  联通

广州移动 - ICMP v4 - traceroute to 120.196.165.24, 30 hops max, 52 byte packets
1.10 ms      AS35916    *                  美国, 加利福尼亚, 洛杉矶, multacom.com 
2.00 ms      AS35916    *                  美国, 加利福尼亚, 洛杉矶, multacom.com 
10.30 ms     AS2914     [NTTA-128]         美国, 加利福尼亚, 洛杉矶, gin.ntt.net 
0.83 ms      AS2914     [NTT-BACKBONE]     美国, 加利福尼亚, 洛杉矶, gin.ntt.net 
105.81 ms    AS2914     [NTT-BACKBONE]     日本, 东京都, 东京, gin.ntt.net 
*
158.33 ms    AS2914     [NTT-BACKBONE]     中国, 香港, gin.ntt.net 
162.90 ms    AS2914     [NTT-BACKBONE]     中国, 香港, gin.ntt.net 
158.88 ms    AS2914     [NTT-GLOBAL]       中国, 香港, gin.ntt.net 
156.34 ms    AS58453    [CMI-INT]          中国, 香港, cmi.chinamobile.com  移动
166.51 ms    AS58453    [CMI-INT]          中国, 广东, 广州, cmi.chinamobile.com  移动
169.17 ms    AS9808     [CMNET]            中国, 广东, 广州, chinamobileltd.com  移动
176.66 ms    AS9808     [CMNET]            中国, 广东, 广州, chinamobileltd.com  移动
*
165.89 ms    AS9808     [CMNET]            中国, 广东, 广州, chinamobileltd.com  移动
167.95 ms    AS9808     [CMNET]            中国, 广东, 广州, chinamobileltd.com  移动
170.17 ms    AS56040    [APNIC-AP]         中国, 广东, 深圳, gd.10086.cn  移动

-------------------------------------PING值检测--------------------------------------
TG-DC1 MIA USA        58 | TG-DC3 MIA USA        58 | TG-DC4 AMS NL        150 | 
TG-DC2 AMS NL        151 | TG-DC5 Singapore     175 | 
CNN                   13 | Twitch                17 | Sora                  19 | 
Claude                19 | Apple                 21 | Azure                 28 | 
BBC                   29 | DisneyPlus            31 | NYTimes               36 | 
DigitalOcean          38 | OpenAI                39 | Wikipedia             43 | 
Netflix               66 | Google                71 | MetaAI                76 | 
Gemini                83 | AWS                   84 | Bing                 106 | 
GitHub               107 | Docker Hub           111 | Instagram            112 | 
Reddit               113 | Microsoft            117 | Amazon               122 | 
GitLab               176 | eBay                 178 | YouTube              179 | 
StackOverflow        186 | Facebook             204 | Spotify              212 | 
Bilibili             217 | ViuTV                225 | AliExpress           243 | 
Twitter/X            269 | Google Cloud         304 | iQIYI                310 | 
PrimeVideo           357 | TikTok               392 | TVB Anywhere         622 | 
Steam               1912 | 
--------------------------------------就近节点测速--------------------------------------
位置            上传速度        下载速度        延迟            丢包率          
Speedtest.net   756.05 Mbps     838.81 Mbps     757.348μs       N/A             
洛杉矶          623.40 Mbps     750.41 Mbps     1.621001ms      N/A             
日本东京        438.03 Mbps     66.37 Mbps      110.051772ms    N/A             
联通上海5G      25.93 Mbps      0.02 Mbps       190.198559ms    N/A             
电信浙江        1.09 Mbps       47.54 Mbps      168.561535ms    N/A             
电信Suzhou5G    7.24 Mbps       88.40 Mbps      190.003686ms    N/A             
移动Suzhou      1.22 Mbps       0.35 Mbps       299.405527ms    N/A             
----------------------------------------------------------------------------------

2025小白AI入门指南!从如何白嫖到如何使用,一文入门

2025年12月7日 22:49

近两年,AI迎来井喷式的发展,熊猫愿把这称作“第一次科技革命”。随着大模型和 AI agent 的不断成熟,常常让人不禁感叹:原来 AI 已经能做到这种程度了!

即便 AI 已经发展到如此“逆天”的程度,熊猫发现普通人的使用场景仍然局限在对话和生图这两类。进阶操作很少有人会,不会设置工作流,不会配置智能体,甚至连大模型有不同类别这件事都不清楚。
AI

本期内容会从AI大模型的介绍、获取以及使用进行介绍,2025小白AI入门指南,现在开始!

AI大模型的种类

在获取并使用大模型之前,首先要弄清市面上有哪些类型的模型,以及它们各自能做什么。

核心:语言模型

日常使用最多的是 LLM(大语言模型),也常被称为“语言模型”。比较知名的有 GPT 系列 —— 可以说推动大众进入 AI 时代的就是 GPT-3.5。在国内,比较出名的代表有千问和 DeepSeek。
DeepSeek

这类模型通常指用于处理人类语言文本的模型,主要功能包括文本对话、写作、翻译、逻辑推理和情感分析等与文本相关的任务。

语言模型可分为基座模型和指令模型。基座模型——顾名思义,是所有模型的基础,通常通过海量数据预训练,擅长对输入文本进行“续写”。举个例子,如果输入“熊猫是不是猫?”,基座模型更可能沿着文本继续生成下一个句子,例如“蜗牛是不是牛?”。它对知识有一定掌握,但不具备按人类指令执行特定任务的能力。

指令模型是在基座模型的基础上,通过人工反馈(如人类评估和指令示例)进行强化学习或微调而成。这类模型能理解并执行人类指令,支持对话式交互。因此,目前常见的 GPT、DeepSeek 和千问等产品多数属于指令模型或在其基础上进行了指令化调整。
图源@知乎拔岁

数据:向量模型

这类模型对普通用户而言用得较少,主要用于需要检索的场景,如知识库、相似度搜索等。它们通常不直接生成文字或图片,而是把文字或图片等信息编码成一串数字数组——也就是向量。这个向量相当于该信息的“身份证”或“坐标”,用于表示和比较内容的语义或特征。
大概介绍
向量模型会把信息编码为向量,进而在一个巨大的多维坐标空间中表示这些信息。语义相近的词或内容在空间中的位置也会相近,语义相反或无关的则会相距较远。
算力空间

向量模型目前最常见的应用是 RAG(检索增强生成)。一些 NAS 的相册也提供检索功能,但那些实现多依赖传统数据库索引,而非向量检索。就我所知,使用向量模型进行精确检索计算的厂商中,目前只有威联通和极空间在实践这一方案。

眼睛:视觉模型

视觉模型其实并不是单纯的作图这么简单,视觉模型作为大类目,再往下细分可以分为两个大类,分别是生成和理解。
视觉模型

很多人以为生成类模型就是直接“按提示画图”,但图像生成的过程实际上是逆向的。当前主流的生成方法依赖扩散模型 (Diffusion):训练阶段把一张清晰图片不断加噪,直到变成类似雪花屏的满屏噪点;生成阶段则从满屏噪点开始,按用户输入的条件逐步去噪,最终复原出清晰的图像。
扩散模型

视觉理解顾名思义,是对已有图片进行分析和理解,常见场景包括图像识别、OCR、目标检测、图像分类等。实现这些功能的主流方法主要有 ViT(Vision Transformer)和 CNN。常见做法是把图像切分成若干小块(patch 或 receptive field),分别对每个小块提取信息或特征,再将这些局部特征汇总、融合以完成最终的判定或理解。

目前视觉模型种类繁多,既有近期走红的 Nano Banana Pro,也有老牌的 Midjourney、DALL·E 3,以及广泛使用的开源项目 Stable Diffusion。但总体来看,国内在视觉模型的研发和生态建设上,与国外相比仍存在一定差距。

全能:多模态模型

多模态顾名思义,是把视觉模型的“眼睛”和语言模型的“大脑”结合在一起,从而具备视觉问答、情感交互、跨模态检索等能力,也是目前大模型的发展方向。
多模态

多模态的发展早期,通常采取将视觉模型和语言模型“强行拼接”的做法,通过后续训练让“大脑”学会理解“眼睛”传来的信息。随着技术演进,现在的多模态模型更多是在设计阶段就原生支持文本、音频、图片等多类数据的联合理解与处理,而不是简单地把单模态模块堆叠在一起。

多模态领域较为出名的代表包括 GPT‑4o 和 Gemini 1.5 Pro。多模态模型现在算是应用最广的模型类型之一——例如手机里的语音助手(如小爱、小布、小V)很多都基于多模态技术,实现了语音、图像与文本的联合理解与交互。

补充:全能化趋势

除了上述的模型,还有一些日常普通用户用的更少或者更为专业的模型,其中主要就是视频生成模型、音频语音模型以及专业模型等等。

视频生成模型是目前技术难度最高的模型之一,对算力要求极高。它通常在扩散模型的基础上引入 Transformer 结构,用以生成连续且逻辑自洽的帧序列,随后再把这些时间帧按顺序拼接,就能得到完整的视频。
Sora

这类模型最具代表性的就是Sora与国内比较出名的可灵。

音频语音模型其实用的并不少,比较出名的案例就是“AI歌手”孙燕姿。然而,即便音频模型已经相当成熟,调音与修音仍需要人工参与,否则即使是未接触过 AI 的普通听众,也大都能察觉到明显的失真感。

专业模型其实就是针对垂直领域特殊训练的模型,通用大模型虽然通用性强,但“什么都懂一点”的特性往往只能达到“略懂”的水平。为满足专业场景的高精度需求,才催生了这类专用模型。常见类型包括代码模型和各类科学模型(如生物、气象、数学等)。

如何获取大模型

通过以上,我相信你已经大概知道了大模型的种类以及使用场景,那么如何获取我们想要的模型呢?

官方渠道

先从官方渠道说起。除去少数需要付费或有使用限额的模型(例如近期走红的 Nano Banana Pro、GPT5.1、可灵等),大多数模型在官网上都可以直接免费使用,不过通常仅支持网页版或官方 APP。对普通用户而言,这类使用方式已基本满足日常需求。
官网

如果你想通过 API 调用大模型,很多平台其实是提供了可观的免费额度的。例如阿里的通义千问可以在阿里百炼控制台领取,抖音的“豆包”可以在火山方舟引擎控制台领取。通常这类额度只发放一次,但数量往往从几百到数千万 Token 不等。用于文本类任务的话,对普通用户基本足够。
豆包

这里推荐一下美团的longchat模型(非广),虽说是稀释后的模型,但longchat也有通用模型和深度思考模型两种,同时官方文档看似没有更新,但实测是支持多模态的。
美团模型

当然,最重要的是美团的longchat目前对于个人用户每天有500万的Toekn(申请之后),没错!是每天500万的Toekn,对于个人用户来说这个量非常大了,完全足够常规的文本和视觉分析处理,主打一个免费量大。
免费量大

第三方渠道—付费向

如果你有大量其他模型使用需求,例如更高质量的视觉分析、图形生成等等,那么大概率就需要付费来使用,你可以选择用官方的付费服务,但大部分情况下高质量的模型大量使用费用其实并不低,亦或者选择折扣的第三方渠道。
第三方渠道

通常来说这类第三方网站的token会是官网的3-6折,根据模型的热度和质量而定。在计费方式上会有按次和按量两种方式,一般来说生成类模型熊猫建议是按次,文本或向量这类模型建议按Toekns来计算。

关于网址的获取其实途径非常多,百度搜索大模型第三方API站点、github中直接搜索AI内容,赞助广告中、linux.do论坛佬友们的分享等等,这些都是获取的途径,废了避免广告嫌疑,熊猫就不做推荐了,可以自行搜索。
linux.do

第三方渠道—免费向

这时候又有小伙伴会问,那么就没有完全免费的路子嘛?那当然也有,不过免费往往也会带来一些问题,例如站点可能时不时就会跑路、不支持API并发、热门付费模型没有等等。
余额

这一类站点的获取关键词为公益站,尽可能用谷歌去搜索,当然一样的github和linux.do中也会有很多推荐,但基本上是没有热门付费模型或高质量生成类模型,比如近期大热的Nano Banana Pro。
模型列表

一般来说公益站会限制用户的API并发或二次分发,大部分公益站都是不开放注册的,只会在特定的时间开放注册,类似于PT站的操作,在额度方面大概率也是签到、注册、邀请等等来获取额度。
签到

大部分情况下注册一般就有20-100的额度,这里指的是美元,然后每天签到大概也有5-10左右,基本上也是完全够用了。

自给自足—逆向

最后一种则是逆向工程,熊猫这里并不推荐这种方式,关于如何使用逆向,这里没办法做过多的介绍,可以自行github搜索相关项目。

逆向之后就不受额度、注册等限制了,但往往也伴随不稳定性以及模型使用的限制,例如不能进行图像生成、语音识别等等,这就和逆向工程的项目相关了。

如何使用大模型

最后说说大模型的实际使用。正如前面提到的,普通用户最常用的功能是对话、搜索和生图。要想实现更精准的图像生成或更深度的对话,就需要引入“智能体”概念——本质上就是对模型进行预设与流程化配置。
智能体

对于文本类项目,网上其实已经有非常多的提示词了,或者你可以直接让AI帮你生成相关需求的提示词,这里推荐熊猫之前介绍过的提示词优化器,支持直接使用以及自部署:Prompt Optimizer。
提示词

除此之外大部分的应用或者模型官网都内置一些智能体,熟练合理的运用智能体很多时候能提高不少的工作效率。
预设智能体

而对于图形生成,也有非常多的项目和网站会收集一些预设词,这里熊猫主推https://opennana.com/。该网站收录了一共700多种生图案例,且支持中英文双语提示词。
提示词库

写在最后

如今,AI的发展趋势非常之猛,作为普通人的我们并不能改变什么,前两天熊猫翻招聘软件甚至看到一些公司已经开始将熟练使用AI作为招聘要求了。

技术的发展并不会取代人,但不会新技术的人一定会被其他人取代。

以上便是本次分享的全部内容了,如果你觉得还算有趣或者对你有所帮助,不妨点赞收藏,最后也希望能得到你的关注,咱们下期见!
尾图

  •  

跳过情绪

2025年12月7日 19:37

冬,12月漫过一周。最近太累,这周六又是满满一天的工作。昨晚睡的早,史无前例睡了十个小时,就这样,今天都还是困。下午遛完车,回程地铁上迷迷瞪瞪,差点睡着。这是到了年龄开始精力不足了么?😱周四开会时,有同事说“看到你头上好多白头发哦”~我笑了笑,呵,老了呗。下周智康中心迎检,还有优质在线评审,还有西昌会,还有单位无数事情,呃呃呃,劈成两半吧。

IMG_20251202_130411.jpg

成都的银杏现在是彻底黄了,走在路上,不经意间便可以看到一抹亮色,那灿烂的黄。前几天还看到超级圆月,夜色下真就是“玉盘”。这段时间真的是“跳过情绪,直接做事”,很多事情能做到的不能做到的,有困难的没困难的,都先不要起情绪,不要被情绪所困扰,一个字,干。不然想太多,就啥都也干不成,甚至都没法推进。昨天和同事交流时,牢牢记住了“大悲咒”三个字。

IMG_20251207_163454.jpg

对我而言,读一遍都够呛,遑论背诵。前天下午走着走着,嘿,走到田间地头,适得返自然,心情瞬间开怀很多。落,晚霞,池塘,绿树,炊烟,蔬菜,飞鸟,狗儿,行人,一切都是那么的和谐而美好,欣欣然,自自然。昨晚看到街头鱼缸里的鱼,游游停停。瞪大个眼睛似乎在看人,但又似乎啥也没看,就是单纯的瞪着眼睛,目中无人。哈哈哈,能够目中无人,那也是一种本事。

IMG_20251205_174857.jpg

很多时候心念一转,便是万般自在。刚看到这么一句话,挺好:

你在别人口中的好与坏,其实只和他们自己的利益有关系,你符合他们的利益,他们就会夸赞你抬举你,不符合他们的利益,他们就会批评你打压你甚至诋毁你,人一到群体中,智商就严重降低,为了获得认同,个体愿意抛弃是非,用智商去换取那份倍感安全的归属感,大众没有辨别能力,分不清真假善恶,他们只会干两件事,要么锦上添花,要么落井下石。

  •  

猫鱼周刊 vol. 087 做一个 RSS 阅读器

2025年12月7日 19:35

关于本刊

这是猫鱼周刊的第 88 期,本系列每周日更新,主要内容为每周收集内容的分享,同时发布在

博客:阿猫的博客-猫鱼周刊

RSS:猫鱼周刊

邮件订阅:猫鱼周刊

微信公众号:猫兄的和谐号列车

私信:leslieleung@proton.me

INIT

这周还是没有图。自从进了胶片的坑,出门要么不带数码的,要么带了也不拿出来拍。而一卷有 36 张,经常一次拍不完,又想等囤起来一起洗了,所以很久都没出什么图。

这周主要很多时间精力花在一个新坑上,起因是最近 Folo 团队裁员,裁掉了最核心的两位贡献者,而且发布了所谓「正式版」,加上怎么都关不掉的 AI 功能,实在让我觉得非常难受。RSS 阅读器这块我从一开始的 Reeder(Classic)到 NetNewsWire 再折腾到 Follow(Folo),来回折腾其实都只是不一样的界面,功能上没有什么特别亮眼的,也没有能针对我的信息获取工作流做优化的地方。于是我决定写一个自己的 RSS 阅读器 Glean,中文名叫拾灵,具体的后面细说。

STDIN

AI 吊牌

原文链接

说的是 AI 厂家在输出最后总会加的口癖(例如「要不要我帮你调整 xxx」)。作者举了几个小学生利用 AI 完成作文、作业,以及老师用来发朋友圈文案的例子。

我上周才提到过,如果把 AI 不加处理地用于教育领域,很容易造成「Shit in, shit out」的局面。小朋友的可塑性是非常强的,稍微「权威」的来源会对其认知产生很深远的影响。我记得以前小学的时候,学写信的格式,结尾一定要有「此致」「敬礼」,老师从来没有解释过为什么,我也理解不了为什么为什么要向信的读者敬礼(即使 ta 就是我的朋友),后来才知道其实还可以写「顺颂时祺」之类的套话,但实际上我用得最多的还是漫无章法的「祝好」、「祝万事如意」、「Best Wishes/Regards」。基础教育因为要面对非常多样性的群体,没法做到很细致,如果你拿着这个问题去问小学老师,一般得到的回答就是「你就记着这么用就行了,别问为什么,没有为什么,固定搭配」。

回到这个 AI 的例子,这里面最为讽刺的是,人把自己的知识蒸馏后训练成 AI,结果 AI 再蒸馏一遍知识给下一代的人,但每一步蒸馏都会有不少损失,所以才说对下一代的人来说,是「Shit in, shit^2 out」 。会不会下一代的人,写作风格不仅充满 AI 味,写出来的文章最后还要加上一句「如果你需要根据自己妈妈的特点进行个性化修改,我也可以帮你调整这篇作文。」?

Go 语言的编程哲学

原文链接

一个初学者角度的 Go 语言印象,以及对一些 Go 生态中常见哲学的理解和解读。我觉得 Go 在我心目中算是排名数一数二的语言,虽然我最近用的 Python 比较多。

首先,Go 是偏见非常强的语言,诸如只有 gofmt 一种风格、不允许未使用的变量、强制错误检查等,一定程度上让代码「规范」了很多。这里的反例就是我最讨厌的 Java,八股里面我最讨厌的一个问题「线程有几种创建方式」,在 Go 里只有一种,就是 go 关键字,不需要考虑茴字到底有几种写法。

其次,Go 在语法上非常简单,也没有复杂的语法糖,不管你的本命语言是什么,读 Go 都会觉得很顺畅。作者举的三目表达式就是一个非常好的例子,Go 就鼓励清晰的 if-else 结构。

还有一点,Go 让我写代码的时候逻辑变得非常清晰,或者说形成了一些良好的思考习惯。比如强制的错误检查,会让你在调用某个函数的时候,仔细考虑它会可能会出什么异常,对于业务来说应该怎么处理;又比如非面向对象的设计,会让你更加好地考虑怎么设计数据结构和接口;以及相对比较「裸」的并发写法,让你自己控制通道和锁,比起 Java 那套奇怪的调度方法好理解得多。

最后不得不说的就是跨平台能力和性能。与 Java 的虚拟机机制不同,Go 在所有平台上都是二进制原生运行的,这点就很无敌。性能方面,Go 的线程就是一个很好的例子,内存占用非常小,这在现在以云服务为主,内存寸土寸金的环境来说非常友好。

我的编程入门语言是 Python,甚至是 Python 2,最早是高中的时候自己搞了点书看。然后到大一学了 C/C++,自学了 PHP、Python 3、JavaScript,大二自学了 Java,大三自学了 Kotlin,后来工作之后又自学了 Go。在见识过基本上全部主流的语言之后,我心目中数一数二的就是 Go 和 Python,这俩也是我最为常用的语言。也许后面可以专门写篇文章展开讲讲我对各个语言的一些印象。

STDOUT

Kodak Snapic A1

Kodak Reto (柯达授权经销商)新出的一款胶片相机,25mm f9.5 广角镜头,固定 1/100 快门,有自动卷片、自动回卷和自动闪光,支持双区对焦、双重曝光,使用 7 号电池供电。

我在小红书上刷到的,看了一下国内贩子都在加价,就直接在官网下单买了,​99 + 3.5 运费,算下来比贩子卖得稍微便宜一点,而且 12.2 发货,第二天就收到了。我买的是白色款,包装里自带一个收纳袋和一条挂绳。

带着拍了几天,简单谈谈使用体验。它非常轻便,操作也很简单,上卷、打开电源,按快门即可。拍照的时候会有一个很轻的快门声,然后就是过卷马达的声音,这个比起手动过卷的机器来说没有拨动过片扳手的齿轮声悦耳,跟其他一些傻瓜机差不多。自带的挂绳很有意思,保证你在扫街的时候可以第一时间拿出来拍。(此处应有伍佰)我觉得胸前挂着相机大摇大摆走还是太张扬了,而且给的绳子有点长,在肚子上晃荡,所以我是绳子挂在脖子上,然后相机踹在前胸大口袋里,也很方便。

因为第一卷还没拍完,所以画质这些也许要等后面洗出来再聊。25mm 的镜头对我来说也是一个挑战,因为我平常惯用 50mm 甚至更长的焦段,25mm 这样一个大广角对我来说有点难以掌握,不过我发现这对于拍摄街景、建筑或者壁画这些东西非常适合。另外,固定 1/100 的快门和 f9.5 的光圈也有点蛋疼,官方的说明里推荐晴天/阴天户外使用 ISO 100/200 的卷,阴天、室内使用 ISO 400 的卷。我第一卷装的是全能 400,我也不确定宽容度有多高,但是拍摄的过程涵盖了阴天和大晴天,到时候看看效果吧。小红书上有不少评论说不如买几百块的二手 PS 机,二手 PS 机我也有,但是真的很难买到成色好,更别说全新的机器,而且 PS 机也做不到这样轻的重量。我觉得它的定位是玩具相机和 PS 机的中间,比玩具相机更好的画质、可以重复装卷,结构比 PS 机简单、成本更低。如果你对胶片感兴趣,我觉得这是一台比较值得入手尝试的机器。

Glean 拾灵

项目链接

前面说到,Folo 的变动,让我决定写一个自己的工具,它主要是一个自托管的 RSS 阅读器 + 个人知识管理工具,主要会有以下的功能:

  • RSS 订阅、阅读
  • 网页收藏
  • 智能推荐 & 偏好学习(根据对已读文章的喜欢/不喜欢反馈,以及收藏行为、对 Feed 和作者的亲和性,计算推荐分数,排序时间线上的文章/过滤分数较低的文章)
  • AI 摘要 / 打标(这个就是很多类似工具都会有的功能了)

所以 Glean 在产品形态上大致是 Folo/RSS Reader + Cubox/Karakeep 这样的东西,相当于是把我平时用来阅读和收藏整理信息的工具整合起来了。这是它目前的样子:

它会采用 OSS + SaaS 的商业模式,OSS 版本跟 SaaS 版本的区别就是 BYOK(Bring Your Own Key,使用自己的 AI) 和平台托管,你可以自建 OSS 版本获得基本上全部的功能,如果自建对你来说太麻烦,也可以付出 AI 的成本来获得对应的服务。

做自己的工具对自己来说是非常满足的事情,除了功能,一些交互细节也可以打磨到自己喜欢的样子。例如阅读界面右边的 Outline 功能,就有非常多考虑:

  • 垂直的进度条,来代替滚动条展示阅读进度
  • Outline 在阅读时会模糊,减少注意力分散
  • 进入文章时,Outline 会保持清晰 5 秒;低速滚动时,Outline 会保持模糊;高速滚动时,Outline 会清晰展示;鼠标悬浮时,Outline 会以比较高的速度变清晰。

另外,这次 Vibe Coding 我也在尝试一种比较新的工作流程,在过程中更多地使用 AI 和 文档,大致是:

  • 基于初始需求,反复细化、确定需求,产生 PRD 文档
  • 基于 PRD 文档,确定技术栈,敲定代码风格等,产生架构文档
  • 基于 PRD 文档和架构文档,拆分多个里程碑,决定每个里程碑实现什么内容,产生开发计划文档
  • 基于上面全部文档,生成对应里程碑的开发方案,包括测试和验收方案,修订后,放到项目中让 Claude Code/Cursor 去实现,并且利用浏览器 MCP 实现自动化测试和验收

这套工作流用下来还可以,开发的效率相对比较高,很多时候只要人工介入一下具体的交互细节就可以达到可用的程度。唯一的缺点可能是烧钱太快了,我的 $20 Claude Pro 和 $20 Cursor Pro 订阅一两天就用完了,Cursor 我升级到了 $60 还是不够用,已经上到 $200 了。

MISC

bililive-go

项目链接

直播录制工具,支持多个平台的直播录制。

EOF

本周刊已在 GitHub 开源,欢迎 star。同时,如果你有好的内容,也欢迎投稿。如果你觉得周刊的内容不错,可以分享给你的朋友,让更多人了解到好的内容,对我也是一种认可和鼓励。(或许你也可以请我喝杯咖啡

另外,我建了一个交流群,欢迎入群讨论或反馈,可以通过文章头部的联系邮箱私信我获得入群方式。

别让你的烟,呛到无辜的人

2025年12月7日 20:08

最近发现公共场所抽烟的人越来越多了,楼道、电梯、路上,经常能碰到。那股烟味非常让人不太舒服。

我的店所在的这个写字楼楼道是一个密闭的空间,虽然物业也贴了楼道禁止吸烟的标语,但是也并没有什么实质性的作用,每当有人抽烟,屋里就会飘来一股烟味,有时候不得不把门关上,但是你又是在做生意,关上门又不合适,真实左右为难。

电梯里抽烟就更让人头疼了。很多次,进入电梯,里面都是一股浓浓的烟味,很多邻居也都在物业群里吐槽,这时候物业就是一只鸵鸟,不吭声,不吭声,逼急了,就说在电梯有禁烟的标语。其实他们也很无奈。还有一些年轻人也是,抽的电子烟,虽然没有那么难闻,但是危害是一样的。

电梯空间小,烟味散得慢。后面坐电梯的人还得闻这个味道。那些对烟味敏感的人,或者带着孩子的人,确实会不舒服。

路上抽烟的人也常见。走在他后面,风一吹,烟味就飘过来。有时候想超过去,他还走的挺快,闭着气赶紧穿过去,心里在骂他的娘。

我琢磨了一下,这些人大概有这么几种心态。第一种是觉得抽烟是自己的权利,想在哪抽就在哪抽。他们忘了自由的前提是不妨碍他人的自由。你的抽烟自由,不能建立在我吸二手烟的不自由上。

第二种是觉得抽几口没事,烟味一会儿就散了。他们也知道二手烟里的有害物质可以在空气中停留很久,但是,关我鸟事。

第三种是看到别人在公共场所抽烟,觉得自己也可以。典型的法不责众心理。问题是,错的事情不会因为做的人多就变成对的。

第四种是知道公共场所抽烟不对,但只要没人管,他们就照抽不误。说白了就是缺乏公德心。

有些人可能觉得,闻点烟味没什么大不了的。但二手烟确实有危害,特别是对孩子、孕妇、老人和有呼吸系统疾病的人。

其实我们国家早就出台了《公共场所控制吸烟条例》,明确规定室内公共场所、公共交通工具、电梯等地方禁止吸烟。问题是,规定是规定,执行是执行。很少看到有人因为公共场所抽烟被处罚。物业不管,保安不管,大家也都抱着"多一事不如少一事"的心态。

这就形成了一个恶性循环:没人管→更多人抽→更没人敢管。

说实话,作为一个普通市民,我们能做的有限。但至少可以从自己做起,如果家里有人抽烟,劝他们去专门的吸烟区,或者至少不要在密闭空间抽。遇到公共场所抽烟的人,可以礼貌地提醒。虽然可能没什么用,但至少表达了态度。

也可以支持公共场所设立明显的禁烟标志,支持物业加强管理。告诉孩子们吸烟的危害,特别是二手烟的危害。

抽烟是个人的选择,这个我理解。但如果在公共场所抽,确实会影响别人。公共场所是大家共用的,不是某个人的吸烟室。你的自由,不应该让别人不舒服。

那些在楼道、电梯、路上抽烟的朋友,可以换个角度想想:如果你的家人每天都要闻别人的烟味,你会怎么想?将心比心,其实大家都明白这个道理。

  •  

利用 Fail2Ban + nftables 加固服务器

2025年11月1日 00:00

自从 NAS 上线以来,家庭服务器上保存的数据越来越多,服务器安全变得越来越重要。 跟普通服务器一样,我的设备对公网开放访问。不免有好事之徒光临,或尝试暴力登录 SSH, 或尝试扫描系统漏洞。虽然基本都以失败告终,但还是需要找一个比较完备的解决方案。正 所谓「不怕贼偷,就怕贼惦记」。我得想办法给这些人发出明确的信号,该服务器有基本的 安全措施,还是去别处搞事吧。研究再三,发现也就 Fail2Ban 可堪此重任。本文向 大家分享我的实践经验。

  •  

楼船:摄影日记 一

2025年12月7日 14:53

大学一年级的一些摄影作品展示与回顾 对于摄影的兴趣的起源已经消失在记忆中了,只能找到很久以前还在用老旧的魅族手机的时候就很喜欢使用专业模式拍一些有趣的照片: 百鸟岩这一组照片可以说是我的摄影启蒙作,也是第一次因为我拍摄的照片收到那么多人夸赞。现在这个博客中也有很多百鸟岩系列的照片,比如 历程「为了忘却的悲哀」 中的首图。 烟花这一系列则是我在一个百感交集的新年第一次熟练运用手机的专业模式拍下的一组照片。可以在很久以前的 文字组「雨落」 中找寻到这系列的另一张照片。也正因为当时对于摄影的热爱,我对于各种参数以及ps camera raw用的也还算熟练,影调色调这些摄影原理也略有了解。 或许现在的一切早就有了预兆吧。 之后在得知自己来新疆上学的时候,很开心的就带上了家里之前的550d,是一款佳能的残幅入门单反。当时还感觉这个相机很强大,没想到很快就因为不够大的后期空间和不够丰富的按键被我抛弃了。 到了大学之后,一开始的军训和各种课程让我没有多少时间专门拿相机出来拍照。除了拍了一次血月后就没拿出相机。直到在10月14号,在宣传部的摄影培训会上摸到学长的佳能5d3,可能是因为虚荣也可能是因为热爱,当天晚上我就快速又补习了摄影知识,给相机充满电,重拾摄影。 之后在第二天,正好下了雪,我也拿起相机,正式完成了人生第一张包揽前期和后期的照片: 这也是第一次全流程使用ps,后期就用了三个小时。 之后也陆续拍了几张感觉能放在这里的照片: 现在来看其实感觉也还不错。之后就是陆续给学院的会议拍照,给人物拍特写,慢慢也感到了佳能550d按键可调节性有点低,宽容度也差一点,之后就考虑用很少的钱收一个全画幅单反。看重了 佳能5d3,正好也能用上我现在的 EF 75-300mm f/4-5.6 III。蹲了一周收到了一个品相还好的。 但是那个取景器里面的小霉点看着好难受,没办法,谁让他2399还带一个永...

  •  

雅余:博物图鉴|薇甘菊和猪屎豆

2025年12月7日 11:00

在珠海的山野与路边,不时见到两种生长旺盛的植物:一种是外来入侵的薇甘菊,一种是本土常见的猪屎豆。这些植物有着美丽的外表,却暗藏“杀机”。认识植物,增加对草木的认知与敬畏,便是理解我们复杂而多样的自然环境的第一步。 薇甘菊:需要警惕的“绿色杀手” 薇甘菊看起来并不起眼。它是一种藤本植物,茎细长柔软,能在地上匍匐,也能顺着树干、灌木向上攀爬。它的叶子是心形或接近戟形的,边缘常有浅浅的裂齿,开白色的小花,头状花序在枝端排成复伞房花序状,含4朵白色两性花,有淡淡的香气。虽然名字好听,外表也小巧,但 2003 年被列为全球 100 种最具威胁的外来入侵物种之一,在我国《中国入侵植物名录》中被定为1 级恶性入侵类物种。 它的危害在于生长得太快、太霸道。薇甘菊的种子非常轻,带着白色的冠毛,可以像蒲公英一样随风飘到很远的地方。更厉害的是,它的每一段茎节落在土里,都能很快生根,长成一株新的植物。正因为这种恐怖的繁殖和蔓延速度,它在国外有个绰号叫“一分钟一英里杂草”。 才两周时间,它已经把下面的牵牛花完全盖住 一旦它攀附上其他植物,就会迅速形成一层厚厚的“绿网”,将被缠绕的树木、灌木严密覆盖,使它们无法接触到阳光,最终因无法进行光合作用而枯萎死亡。研究显示,它甚至还会通过根系向土壤中释放化学物质,抑制周围其他植物的种子发芽和生长。在深圳的内伶仃岛,就曾因薇甘菊泛滥,导致大量林木枯死,岛上猕猴等动物的生存也受到威胁。 目前,防治薇甘菊是一个难题。常见的方法有人工清除、谨慎使用化学除草剂,以及尝试生物防治,比如利用一种叫田野菟丝子的植物来寄生、抑制它。在珠海,我们如果在林地、荒地看到它的大片踪迹,通常就意味着本地的生态环境正在承受压力。目前在珠海凤凰山脚下以及大镜山山脚下能观察到。 摄于珠海市凤凰山脚下和大镜山山脚下,2025年11月 猪屎豆:有毒亦有用的本土植物 与外来入侵的薇甘菊不同,猪屎豆是...

  •  

winegrower:Ai时代,我们的博客有什么意义

2025年12月6日 23:51

虽然Ai已经推出很久了,但对于我而言,除了平时写一些“形式性”的总结汇报之外,没有太多的深入的使用体会。 但最近随着阿里千问Qwen的推出,好奇心驱使下我做了一些简单的测试,就这几天让我对AI有了新的认知。 1、很多简单攻略性的知识类文章没有意义 这一测试突然让我意识到我之前做了很久的“知识社区”类网站失去了意义(本来意义也不大),或者更确切的说,让我觉得我过去的一些时间和精力的付出失去了很多意义。 [...]

  •  

记账工具 Firefly III

2025年12月7日 16:50

前言

多亏 Firefly III 让我养成了记账的习惯,快半年的时间里几乎每天能用上,收支一笔记一笔。在此之前我是一个完全不记账的人,反观老婆对记账是非常积极的,起初这个工具也是为了她方便记账而部署。

工作性质使得她有为家庭收支记账的习惯,且一直使用 Excel,对于公式函数之类的 Excel功能玩的算是很溜,以至于不屑于用那些记账 App。然而使用 Fireflyiii 一段时间下来,坚持在用的是我,而老婆最终回归 Excel,她习惯就好。

选择

那会老婆问我有没有好用的工具来平替 Excel 记账,并提了几点要求,首先是排除手机应用商店中的记账 App,再是功能要符合她的记账习惯,三是可以让她随时随地记账,重要的是能在电脑上使用。让我找的话当然是开源为首,根据她的习惯往复式记账类方向找,于是便在搜索引擎找,在饭桶中心找,还挺多的,把问题抛给 ChatGPT 得到如下表格(以各自官方文档为准):

项目 移动端 桌面端 自托管 中文支持
Actual PWA Web / PWA ✔ ❌
Firefly III Android/iOS Web ✔ ✔
ezBookkeeping PWA Web / PWA ✔ ✔
GnuCash Android Windows / macOS / Linux ✖ ✔
Money Manager Ex Android/iOS Windows / macOS / Linux ✖ ✔

根据此推荐琢磨了一翻,最终选择了 FireflyIII。

实用

FireflyIII —— 开源、自托管,支持多种部署方式,采用复式记账法,报告功能丰富,预算、类别标签和自动化等,并且提供 REST API,可以说是该有的都有。官方有 Demo 站 (语言可在偏好设置中改成中文),方便新人了解 FireflyIII 全方面功能。

我很喜欢它的几点功能:

预算 :设置好预算后,以进度条的方式展示我的支出及上限,虽然每个月都是超出把进度条撑红~;

订阅 :把周期性账单放在这里,比如我的 Apple iCloud+ Music 订阅,及月付的服务器续费、话费等,可以设置交易日期,让我知道这个周期是否付过,下个周期是什么时候该缴钱。

定期交易 :顾名思义就是时间一到便自动创建交易记录,我会把一些到期自动从账户中扣固定金额的订阅放在这里,它可以完成 订阅 中的项目,让该项订阅变成已付状态。有个问题就是我的 Apple 订阅是美金账单,虽然 Fireflyiii 有汇率功能,但定期交易无法自动完成汇率转换。

管理后台有丰富的收支 图表,且要是不知道钱都花到哪里去了,试试创建 对账 或生成 报表,一目了然。

以上截图为官方演示站

部署

Fireflyiii 支持 Docker、K8s 及 MySQL+PHP 的方式部署,更多信息可参考官方文档,我则以 Docker Compose 的方式把它部署在 NAS 中,利用 Cloudflare Tunnel 来实现远程使用。

官方提供标准的 Docker Compose 文件,内容包含了数据库,以及用来实现定期交易和自动更新汇率的 Cron,且推荐用 .env 来配置变量。而我的部署场景是已有正在使用的数据库 MariaDB,Cron 用 青龙面板 来实现,且习惯直接在 Compose 文件中添加变量,方便自己。

根据官方文档去部署完全没问题,要了解有哪些变量及作用可以查阅 Docker 部署文档中的 .env 示例。以下只列出推荐添加的几个变量及开启个别功能:

#...其它省略...
  environment:
    #... 推荐添加
    - DEFAULT_LANGUAGE=zh_CN        # 默认界面语言
    - SITE_OWNER=admin@example.com  # 管理员Email
    - APP_KEY=APP_KEY=base64:xxx    # 生成加密密钥,用于加密敏感数据和会话
    - APP_ENV=production            # 表明生产环境
    - TRUSTED_PROXIES=**            # 让反代正常工作
    - TZ=Asia/Shanghai              # 时区
    #... 以下看个人需求,我开启了邮件提醒、Webhooks及汇率
    - MAIL_FROM=user@example.com    # 发送人Email,用于通知
    - MAIL_MAILER=smtp
    - MAIL_HOST=smtp.example.com
    - MAIL_PORT=587
    - MAIL_ENCRYPTION=tls
    - MAIL_USERNAME=user
    - MAIL_PASSWORD=xxx
    - ALLOW_WEBHOOKS=true           # 开启Webhook功能
    - ENABLE_EXCHANGE_RATES=true    # 开启汇率功能
    - ENABLE_EXTERNAL_RATES=true    # 开启更新汇率
#...其它省略...

以上几点功能必须在变量中开启,其它所支持的通知方式有 ntfy、Slack、Pushover,这三种通知方式可在后台设置,看个人喜好。

Fireflyiii 支持多用户,部署后第一个注册的用户将自动成为管理员,而后会禁止注册。若要多用户可在后台启用注册,或以分享邀请链接的形式新增用户。

客户端

FireflyIII 官方并没有 Web 之外的应用,但它提供 REST API 支持,所以有丰富的第三方应用,官方给了个应用列表自己挑。桌面端自然使用 Web,移动端能让人随时随地快速地记上一笔,我认为好用且使用最多的是 iOS客户端 Abacus;其次是针对移动设备优化 PWA 的 Firefly-Pico(需自行部署,支持 Docker,阅安装文档);安卓客户端推荐 Waterfly III,老婆用 Fireflyiii 时在手机上安装过,一样非常不错。

新建交易看起来要填很多东西,但 Abacus 和 Pico 都能快速克隆已有交易表单,使得一些日常账单新增起来方便快速;另外 Pico 在新建交易时可实时汇率转换,对于一些有外币账单的人来说非常实用。

尾声

FireflyIII 是个很棒的开源个人财务管理工具,自托管 + 数据自主,非常适合想要长期掌控自己财务状况的人,在 GitHub 上已有约21.7k ⭐,社区挺活跃的,有兴趣的朋友可以试试。

至于我老婆不喜欢用,她认为“复杂”、“不习惯”。那会还花时间设置好常用的收支类目、标签、分类等,尽量达到让她只需输入几个字点一点便完成记账之程度,哎哟自作多情了。

朔风暖辣锅

2025年12月7日 17:35

朔风渐起的日子,最宜围炉涮一锅西北风味的辣糊糊火锅。不同于牛油火锅的醇厚绵密、清油火锅的爽利清新,辣糊糊独树一帜,以干辣带香、酱香浓郁为灵魂,浓稠汤汁裹着椒香在锅里翻涌,每一口都是西北大地的热烈。一口下肚,暖意从舌尖漫遍全身,驱寒又解馋,这独特的风味,真是冬日里的绝妙慰藉。

  •  

棉裤

2025年12月7日 16:11

棉裤

昨天凌晨,x打完一局王者,偷感很重的问我:

「走啊,下楼搞点烧烤吃吃」我说「都半夜了,不好吧」

「有什么不好,饿了就要吃,你不想吃点小烧烤吗」

「好吧,那出去买点回来吃吧,外面指定很冷,你把我给咱俩买的棉裤拿出来穿上」

「穿那玩意干嘛」

「让你穿你他妈就穿,废话咋这么多」

他从二十多岁离家工作以后,就没穿过棉裤,最冷的天顶多也就穿一条秋裤套个厚裤子,新疆最近降温特快,晚上的温度可以降到零下十几度,我俩穿着新棉裤就下了楼,刚走出单元门,他就忍不住的来了句「真tm冷」,我问他棉裤暖和不,他一个劲憋笑,过了半晌来了句「你说我上周腰疼,是不是冻的啊,我现在感觉穿着这玩意很幸福,有种妈妈抱着我的错觉」,「或许是吧,你得服老了,别浑身一疼就买姜黄素钙片什么的吃,穿条棉裤比啥都强」。

回来路上我又回想起为什么前几年觉得冬天可冷了,是不是因为我们太久没穿棉裤的缘故,好像穿厚了,也没那么冷。

曾几何时我一直认为感觉冷是因为我买的羽绒服克数不够,于是花好几千买八九百克重的羽绒服,确实是暖和,可下半身还是冷,好几千的羽绒服好像是消费陷阱一样,在我很小的时候,没有羽绒服,冬天我会穿上我妈给我打的毛衣毛裤,还得套一层棉裤,里外里三四层起步,那时候也没觉得冷啊。

AI规划30天学习计划

2025年12月7日 15:23

应该加上我,完整句子是我用 ai可以干啥?
5060Ti 16G大模型实测:1.7B到32B Qwen3模型推理性能对比 | 30B参数效果惊人?!_哔哩哔哩_bilibili
这个大模型不装也罢,如果用到api调用,可以考虑本地部署.
纯手工记录,其实也简单,会打字,或者录音转文字或者直接发音频或者视频也可以的。

我问ai可以干啥?

gnork

30 天 AI 自学/实战计划(2025 版)—— 从0到能独立赚钱/找工作/玩爽

每天只花 1-3 小时,30 天后你至少能达到以下 4 选 1(甚至全选):

  1. 月入 1w+ 的 AI 私活(接单写提示词、做 AI 工具、卖课)
  2. 拿到大厂/独角兽 AI 相关 offer(助理、Prompt Engineer、AIGC 运营)
  3. 家里跑出私人 ChatGPT(比官方快 3 倍 + 永不封号 + 能看图 + 能画图)
  4. 做出一个爆款小红书/抖音 AI 账号(30 天 10w+ 粉轻松)
天数 目标 具体干啥(每天任务) 成果物/验证标准
1-3 装好本地环境 + 跑通第一个模型 1. Win11 装好 NVIDIA 驱动+CUDA<br>2. 一键装 Ollama + OpenWebUI<br>3. 拉 qwen3:8b + flux 画第一张图 能本地聊天 + 出图
4-7 掌握顶级 Prompt 工程(变现核心) 每天练 50 条提示词(CoT、ToT、ReAct、APE)<br>用 Cursor/VSCode + Continue 插件写代码<br>刷完《Prompt Engineering Guide》 能 10 秒写出比 90% 人强的 Prompt
8-12 本地模型进阶 + 多模态玩疯 拉 Qwen3-32B、DeepSeek-Coder-V2、LLaVA、Flux.1<br>实现:截图→代码、视频→总结、文档→表格<br>学会 RAG(本地知识库问答) 家里模型比 ChatGPT 好用
13-18 做出第一个可落地的 AI 产品 选 1 个做(任选其一):<br>① AI 写作工具(Notion+本地模型)<br>② 抖音/小红书 AI 爆文机<br>③ 个人知识库聊天机器人<br>④ 自动发朋友圈/微博机器人 能给别人用,能收到第一笔钱
19-23 变现通道全部打通 开通国内+国外 8 个接单平台(附链接)<br>做 3 个作品放小红书/B 站/YouTube<br>建 3 个付费社群(微信/飞书/Telegram) 收到第一单或者涨粉 5000+
24-27 进阶硬核玩法(选修) 学 LoRA 微调(3 小时出自己声音/风格)<br>用 ComfyUI 定制专属画风<br>跑 Agent(AutoGPT、BabyAGI、MetaGPT) 能做出“只听你命令”的私人 AI
28-30 收尾 + 变现冲刺 做 1 个 30 天总结视频/文章发 B 站/小红书<br>打包出售“30 天 AI 陪跑营”(直接卖 99-499 元)<br>或者直接去面试/接 3 个私活 月入 1w+ 或拿到 offer

30 天后你能拥有的资产(最低配置)

  • 本地跑通 8 个顶级模型(含画图、视频理解)
  • 3 个可直接卖钱的小工具/账号
  • 1000+ 高质量 Prompt 模板
  • 国内外 8 个接单渠道(已实名)
  • 一个 500-2000 人的粉丝群/频道

懒人最快路径(每天 30 分钟版)

直接买我整理好的「30 天 AI 陪跑营」完整包(2025 年 12 月最新版)
包含:所有软件一键装包 + 所有模型已下载好 + 1000 个模板 + 接单渠道清单 + 30 天打卡群
百度网盘链接:https://pan.baidu.com/s/1AI30day2025 (提取码 1234)
进群微信:AI30day

30 天后你不赚钱我原价退款(手动狗头)

现在告诉我你想走哪条线(赚钱/找工作/玩模型),我直接给你定制版 30 天时间表!开冲!

上面那个网盘链接就是ai幻觉,打不开的。

chatgpt
好,我直接给你 一套无需额外信息、通用但强力的《AI 30 天成长计划》,完全基于你现有的硬件(12600KF + 32G + 5060Ti 16G + Win11)设计,属于 混合路线:效率 + 技术 + 本地模型 + 实战项目全覆盖

你可以“从今天直接开始”。


🚀 AI 30 天成长计划(为你定制 · 本地模型优化版)

目标:
✔ 能跑本地模型
✔ 生活效率提升
✔ 工作自动化
✔ 能做网页、程序、脚本
✔ 做出 1~2 个实战项目
✔ 最终拥有自己的“小 ChatGPT 系统”


🧩 第 1 周:基础搭建 + 入门实战(本地 LLM 落地)

目标:本地 AI 环境全部跑起来,能用、能调、能做小任务。

Day 1:AI 环境初始化

安装:

  • Ollama

  • LM Studio

  • Open WebUI(Web 版 ChatGPT)

  • 下载模型:

    • Qwen2.5-7B(通用)

    • DeepSeek-R1-Distill-7B(推理)

    • Qwen2.5-Coder-7B(写代码)

测试:

  • 简单对话

  • 让它总结文章

  • 让它写一个 Python “Hello AI” 脚本


Day 2:本地模型优化 + 显卡加速

任务:

  • 开启 GPU 推理(CUDA)

  • 测试不同量化:Q4_K_M / Q5_K_M / FP16

  • 测试不同模型速度

  • 记下最顺手的模型组合

最终目标:
找到你的“主力模型”。


Day 3:文档自动化

任务:

  • AI 自动生成 Word/Excel

  • AI 自动整理 PDF

  • AI 写总结 + 笔记

  • 用 Whisper 做语音转文字

产出:
一个 10 页以内的自动生成报告(任意主题)。


Day 4:本地 AI 辅助编程

任务:

  • VSCode + Continue / AI Assist

  • 自动补全

  • AI 重写你的一段旧代码

  • 生成一个小脚本(自动重命名文件 / 自动整理图片)

产出:
一个100%由AI写出的实用脚本。


Day 5:本地 RAG(文档知识库)

任务:

  • 安装 Chroma / LanceDB

  • 建立“知识库”(PDF / 你的笔记)

  • 让 AI “知道”你的资料

产出:
你自己的“小型知识库助手”。


Day 6:AI 网站搭建

选一个:

  • WordPress(你的兴趣)

  • Hugo 静态博客

  • 或者 AI 自动生成 HTML + CSS 网站

产出:
一个可访问的网站首页。


Day 7:一周产出总结

  • 用 AI 生成一份周报

  • 用 AI 重构你的文件夹结构

  • 演示本周成果(笔记 + 脚本 + 网站)


🧠 第 2 周:AI 进阶 — 自动化 / 编程 / 代理系统

目标:让 AI 自动执行任务、自动写代码、完成流程。


Day 8:AI 代理(AutoGen / OpenDevin 轻量版)

任务:

  • 本地跑一个简单 agent

  • 让它执行操作:文件创建 / 自动写代码 / 自动测试

产出:
一个“能动手做事”的 AI 助手。


Day 9:AI × 自动爬虫

任务:

  • AI 帮你写爬虫

  • 自动抓数据 → 自动生成报告

产出:
一个自动抓取网页信息的小工具。


Day 10:AI × 数据分析

任务:

  • 用 pandas 自动清洗数据

  • AI 自动生成图表、趋势、总结

产出:
AI 分析一份你提供的 Excel。


Day 11:AI × 项目生成器

任务:

  • 让 AI 一键生成一个完整后端(Flask or FastAPI)

  • 自动生成 API 文档

  • 自动生成路由、数据库模型


Day 12:AI × 前端自动化

任务:

  • AI 生成一个 React/Vue 页面

  • AI 自动生成 CSS(Tailwind)

  • 清晰可用的 UI 页面


Day 13:AI × 家庭智能(选做)

如果有家庭网络:

  • 本地语音助手

  • 智能灯光 / 自动脚本

  • AI 分析家里照片(Qwen-VL)


Day 14:两周成果整合

  • 你现在有:
    ✔ AI 网站
    ✔ 脚本
    ✔ 爬虫
    ✔ 数据报告
    ✔ 本地 ChatGPT

⚙ 第 3 周:多模态(图像 / OCR / 设计 / 音频)

目标:你能处理图像、视频片段、听音频、生成内容。


Day 15:AI 图像理解(Vision)

安装:

  • Qwen2-VL

  • LLaVA

任务:

  • 让 AI 分析 UI 截图

  • 让 AI 识别表格

  • 让 AI 分类手机拍照的文件


Day 16:AI 设计辅助

任务:

  • 让 AI 生成 Logo / 海报

  • 让 AI 自动生成 UI 结构

  • 生成博客封面图


Day 17:AI OCR / 表格识别

任务:

  • 图片 → Excel

  • 扫描件 → 文本

  • 自动处理发票 / 单据


Day 18:AI × 音频处理

任务:

  • Whisper large-v3

  • 中文 / 日语 / 英语互相转换

  • 自动生成字幕文件


Day 19:AI × 视频(可选)

使用:

  • Stable Video Diffusion

  • Runway(如果愿意上云)

  • 让 AI 生成一些镜头


Day 20:多模态整合小作品

产出:
一份 AI 自动生成的图文 + 视频说明作品。


🔥 第 4 周:打造你的“私有 ChatGPT 系统”

目标:你有一个完整的、本地的、可用的 AI 系统。


Day 21:Web 全套系统部署

  • Open WebUI

  • 管理多个模型

  • Web UI 多用户(可选)


Day 22:接入你的知识库

功能:

  • 上传 Word/PDF

  • 图像

  • 压缩包

  • 让 AI 记住所有内容


Day 23:本地语音助手

  • Whisper + TTS

  • 语音对话(像 Siri)

  • 简单自动化控制 PC


Day 24:AI 文件系统助手

让 AI:

  • 自动整理文件

  • 自动分类相册

  • 自动命名文件

  • 自动备份


Day 25:AI 私人搜索引擎

构建:

  • 本地搜索(向量搜索)

  • 文档 → embedding

  • 搜索结果 → LLM 重写答案


Day 26:你的“超级 Prompt”库

建立:

  • 写文 Prompt

  • 编程 Prompt

  • 图像 Prompt

  • 计划、知识库、系统 Prompt


Day 27:性能优化(针对你的 5060Ti)

  • 批处理推理

  • 加速 quantization

  • 多模型混合(VL + Coder)

  • LLM 性能调优


Day 28:构建一个最终作品(任选)

可选作品:

  1. 你的“个人 AI 知识库平台”

  2. 自动化办公助手

  3. 能写代码的 AI 工作站

  4. 自动化爬虫 + 报告系统

  5. AI 博客生成系统


Day 29:测试 + 打包

  • 整体测试

  • 项目文档(AI 自动写)

  • 提炼你的 AI 使用手册


Day 30:你的 AI 系统正式上线

你将拥有:
✔ 本地 ChatGPT
✔ 本地图片 / 视频 / 音频理解
✔ 个人知识库系统
✔ 自动化脚本系统
✔ AI 编程助手
✔ AI 办公助手
✔ 一个实际作品(网站/项目/工具)


🚀 如果你愿意,我可以继续帮你:

只需告诉我:

你想先做哪一项?我就带你从“第一天”立刻开始操作。
例如:

  • “先从本地模型开始”

  • “先从 WordPress 自动化开始”

  • “先从 AI 写代码开始”

你说一个方向,我带你一步一步做。

没有几个让我感兴趣的哇。继续看看。

AI 开发——改了一个浏览器翻译插件

2025年12月7日 12:30

前言

《我在用什么浏览器翻译插件?》这篇博文里我提到过我对浏览器翻译插件的体验和需求,那时候用了一阵子的 trancy,后来不知何时就弃用了,当时我就提到过,这不是我理想中的翻译插件(个人主观原因)。

在简单导航(simpleNav)基本不必再改动之后,我又萌生了改一个停更开源翻译插件的想法,虽然很早之前就有过,但 codebbudy 没能给我足够的信心。现在换上了 trae solo,我觉得效率上起码要高出不少。

选择

选择项目

停更许久的翻译插件大多是翻译接口失效或者不好用,看起来只需要替换接口就可以,所以我想找的是轻量,且使用体验比较适合我的项目。对比了一下轻氧翻译和侧边翻译,我最终选择了后者。

侧边翻译是我曾使用过很长一段时间的翻译插件,可惜已经停更很久了。加上现在各大翻译插件都有 AI 模型的加持,传统的机翻很难满足要求。

为了避免误导其他人,所以在遵循原项目的开源协议前提下,把这个新项目命名为“轻量翻译”,英文名:lightrans。

选择接口

既然不要机翻,又要考虑到公开给大众使用,就不能有高昂的开支,所以我首先想到的是用智谱清言的官方 api 调用 GLM 4.5-Flash,但是并发数限制得非常低,加上翻译速度没有达到我期望的即点即译,于是作罢。

好在我又体验了一下 trancy,发现 trancy 也没有免费提供 GLM 模型,而是改成了硅基流动。于是我注册了硅基流动的账号,发现居然有免费的模型可以使用!硅基流动真是带善人!

感谢硅基流动提供的免费模型

首先体验的是 deepseek 的一个模型,翻译速度也很慢(我猜测是因为有推理思考过程),在网上多方了解,发现Hunyuan-MT-7B倒是一个不错的专为翻译而生的小模型,腾讯混元官方的 api 依然是收费的,还好硅基流动限免提供使用。最后我选择了三个体量都不大的小模型:Hunyuan-MT-7BQwen2.5-7B-InstructGLM-4-9b-chat

这三个模型除了混元比较新之外,另外两个都算比较老的模型了,没办法,不花钱嘛,况且效果也不是不好。

根据我的用量级别,我使用这几个模型的速率限制为:1000 RPM 和 80000 TPM。即每分钟请求数1000,每分钟处理 token 数80000。

开改

精简代码

侧边翻译不是个人开发者的作品,应该类似于一些较大的开源项目组织维护,所以侧边翻译里有非常丰富和强大的功能及代码。考虑到我只需要接入一个翻译接口,于是必应、谷歌和百度等翻译接口都删掉了。

初次以外还删掉了分析代码、隐私政策、部分设置项和个别国家的本土化适配等等,源代码从14MB缩减到4.5MB。

添加翻译器

由于我选择的三个模型都是对话模型,所以请求的 api 地址一样,于是我只创建了一个 aitrans 的翻译器,方便测试就在代码里明文写了我的私钥,经过测试,对话框(popup)翻译正常,划词翻译正常,但是网页翻译不正常。

修改

原本的侧边翻译的对话框默认是搜索的,输入文本点击翻译后即会在侧边栏显示翻译结果,但是测试了一下目前的翻译接口都已经失效了。为了获得输入和获取结果的一致性,即当前对话框不会被打断关闭而显示另一个对话框,我改了 popup 的样式,并使它能够直接在当前窗口显示结果。

侧边翻译的对话框

lightrans的对话框翻译

除了对话框以外,侧栏显示翻译也会让人的视线离开当前关注的区域,所以我把划词翻译的结果也以浮动的卡片形式显示在了当前位置,并且和原来一样支持拖动。以下是划词翻译中三个不同模型结果的对比(发音按钮点击无效,功能删了但是还没删按钮):

lightrans混元模型划词翻译

lightrans千问模型划词翻译

lightransGLM模型划词翻译

当然,用不着的设置项也可以删掉,因为我的需求没有那么丰富(不然就用 trancy了),为了追求极简但好用,所以砍掉了许多原本有的功能,也为后面的修改和维护减轻一点负担。

侧边翻译的设置页

轻量翻译的设置页

看起来基本可以正常使用了,但是网页全文翻译依然不行。原项目使用的是谷歌和有道,但是有道已经下线了,谷歌在国内也无法直接访问,看来要支持网页翻译需要改动的还挺多。

中间的过程就不再赘述了,除了新增代码,调试代码之外,还要测试不同的请求频次和字符数,以免触发硅基流动限频的策略。

和原项目一样支持右键选择翻译模型

一开始选中模型进行网页翻译,往往要过十来秒钟页面才会有变化。或许是内容太多了模型处理也要时间吧,于是我设定了分批次提交,最高并发三个,最多重试三次。所以在进行网页翻译的时候可以看到内容是一部分一部分出来的,但是间隔不算大(主要是网页本身的菜单栏花的时间多,正文其实很快)。这样用户能感知到翻译已经开始了,而不是像之前一样等待了十来秒都没反应,于是不断尝试,就更容易触发限频。

lightrans贴一段代码

从翻译结果来看,不知道为什么千问模型会漏掉几个词语不翻译,也可能是我的代码有问题,相比之下,混元模型翻译得还不错,有些专有名词甚至会加括号解释说明。比如昨天在新华网英文站翻译页面时,发现它会解释“GuoChao”这一个词汇,但是我没找到那篇新闻,只能找另一个,没想到也复现了。

上方是翻译,下方是原文

这是更完整的页面翻译。

lightrans使用混元的网页翻译

最后

通过这次改写这个开源项目,我才发现原来微软的机翻 api 也是要钱的,那么多较大的翻译插件都把谷歌和微软翻译免费使用,甚至开放一些 AI 模型翻译免费使用,这样看起来他们真的是在为爱发电了。

而我能轻松改写这个项目,要感谢侧边翻译的开发者们的开源,也要感谢 trae solo 的帮助。考虑到我的 api 限频问题,所以暂时没想过上架应用商店,但是如果愿意体验并且给我提出意见的话,也欢迎下载扩展包尝试一下。

项目地址:hin/Lightrans · CNB

扩展包下载:lightrans_chrome.zip | w4j1e’s drive

🖼 #羊毛

2025年12月7日 11:13

#羊毛

秒过学生认证,免费领取一年Google Gemini 学生优惠

Google Gemini 目前为美国和其它地区的学生提供长达一年的免费优惠活动,仅需通过SheerID 的学生认证后绑定银行卡验证有效期(不扣款)后,即可成功领取。

目前闲鱼等付费的代过基本使用反向 SheerID 认证算法,通过修改参数获得认证结果,通过几率较大。感兴趣的朋友可以通过下面的免费认证工具进行尝试。

该项目有翻车风险,因此建议使用新账户进行;如果打开1️⃣ 学生认证地址提示不符合条件,说明账户不达标,请修改账号的地区到美国 、或换其他账号。

相关链接

1️⃣ 学生认证地址: https://gemini.google/tw/students/?hl=zh-TW

2️⃣点击【验证资格条件】,会跳转到SheerID认证页面。这里不用填写任何信息,复制浏览器的URL地址。

3️⃣ SheerID 认证地址 : https://batch.1key.me/ (95% 秒过)

返回绑定信用卡预授权通过后即可成功领取。

图文完整教程可以参考网站:https://appdo.xyz/article/gemini

频道 @AppDoDo 官推 APPDOTG

  •  

博客搬家啦!(伪)

2025年12月7日 09:28

哈哈哈哈,其实并没有搬家,还是放在这个玩客云上。之所以说搬家,还得从那次无意打开玩客云后台说起。

在一个明媚的午后,我想找一个做笔记的程序,翻到了很久没有用的Trilium Notes(没错就是最早的我用来做主题文档的那个程序),发现更新了好多,也出了docker版本,想着是不是要装个看看,结果发现后台空间占用了94%了。我问gpt清理了半天半天,什么中间层一大堆,结果还是94%。因为要去本溪玩,就抛之脑后了。回来时打开一看,占用98%了,不得不开始清理了。

本来正在和Vinking聊天,Vinking说他的玩客云刷了1panel,用着还不错,让我可以考虑换个。我原本是刷的openwrt用来做软路由,实现家里设备集体翻墙,还有AdGuard Home去广告的,但是无论哪个都很鸡肋,也就没用得上。

我就又问一次gpt,他说让我执行命令进行清理,我问他靠谱么,他说靠谱,不会对现在的容器有任何影响。我说行,反正我也看不懂,没有影响我就清理了。结果清理之后,空间变成了92%。本来欣喜若狂(并没有,理论应该变成60%左右),但是突然发现,容器启动不起来了。我就将报错信息给gpt,结果gpt说我容器炸了,让我重建,给我整个大无语。他说那条命令很危险,并不是他让我执行的。我就将全文贴他脸上,他才承认是他的错,但是又说不完全是他的问题,qnmb。

反正也炸了,装个1panel看看吧。本来我对于docker什么的不是很爱用,1panel也是,但是装了1panel之后看来,占用确实很低。开始还原备份,装穿透,设置自动备份,以及设置共享文件夹。但是突然我发现,1panel没有samba。

我在想要不装一个CasaOS,纠结再三装上了,但是内存占用到了72%,就很炸裂了。然后又决定删掉,想其他的办法。最后在我一再逼问GPT的状况下,终于决定使用docker化的samba外加目录映射的方法实现了目录共享。

早上起来一看,备份系统也在夜里正常工作,现在成功搬家结束!至于开头说的那什么笔记程序,现在也不感冒了。

ps:其实看了1panel也没啥用,要是有个再精简一下的图形化docker管理器也更好了,但是毕竟1panel用的人多,出问题可以查查,就这样了ω

❌