普通视图

浑身瑕疵

2025年12月3日 08:23

有时候我还真不明白,为什么现在大家把AI吹得那么牛逼。因为就是我的使用体验而言,我觉得在写代码的时候,AI真的是挺糟糕的.我用的AI是Deepseek。

理论上无论我用的是什么AI,它们都应该是写代码的高手,无论是写什么类型的代码都应该没什么问题。我这么低端的用户,也不会提出一些什么高端的要求,但事实证明,不知道是我提要求提的不够精准还是怎么着,反正出来的结果我个人感觉基本上没有一次就能符合我的要求。有些时候的确能接近生成我想要的结果,但更多时候那串代码当你复制下来运行的时候会发现根本运行不了。对一个什么都不知道的小白在代码运行不了的时候可以怎么办呢?换一个AI继续提问继续复制粘贴?但如果这个AI有问题,其它AI会不会也有问题呢?为什么人家觉得那个玩意那么神奇,但我自己的使用体验却那么差呢?是不是因为AI已经判断出我这个人是个挑剔的完美主义者,所以故意给我些有瑕疵的东西?每一次都有瑕疵,每一次的瑕疵都说不准在什么地方,幸好绝大多数情况之下,我要的不是AI的全过程,我只是要参考一下它的思路而已。当我要求它给我写某个代码的时候,实际上我更看重的是它用什么途径,而不是它的代码具体是什么。如果它的代码能顺利运行,那当然好,但实际上我感觉一次性就能成功运行的几率可能不足10%。

当我给出一串数字,要求它给我做数据分析。噼里啪啦一大段字很牛逼,一贴进去发现根本出不了结果,仔细看Python的那些错误代码,原来一开始那个屌丝把原始数据都给我整没了一些,因为长度不对,所以整不出结果。我要用Excel的公式实现某些功能,的确噼里啪啦有好多个方案。有些方案一看就直接可以忽略,因为又长又臭,另外一些我感觉有些希望的却发现到Excel里面同样也是出不了结果。至于为什么我也不去纠结了,我直接去研究这些方法的思路到底是什么。我让它用Power Query,也就是M语言给我实现某个功能,结果发现把那堆代码贴到高级编辑器,甚至都无法按确定提交,因为显示语法错误。那个编辑器是一个神经的存在,说语法错误,但定位的那个点实际上没有问题,但那个问题到底在哪里,你得人肉上下文去找。我使用的通常是对半检索法,首先留一半,然后一半的一半。理论上是这么找的,但实际上后面某些功能不要我觉得都无所谓,所以我只要找到那些我需要的就可以了。最终发现,某个用了函数的地方,理论上应该是“=>”。DS给我的代码是“->”。如果这份代码是由图片识别过来的,出现这种等号变成减号,我觉得可以理解,但显然这种事情怎么可能发生?!对一个什么都不懂的人来说,你叫他怎么可能人肉找得出这样的低级错误呢?!那个代码除了那个等号变成了减号以外,最后的结果还有一些无厘头的数据合并,那些数据在前面几个步骤里面已经不复存在了,在最后那个步骤又突然间被提起,真牛逼!

在这种情况下,说AI可以取代人类完成编程,我觉得起码暂时是不行的,尤其是要实现一些高度定制的功能的时候。

巨大风险

2025年12月2日 08:13

明知道会被我妈骂一顿,但我还是要跟她说洗手间那个水龙头已经到了非换不可的程度了。无论是我还是我妈都知道,换那个水龙头的风险非常大。从我们入住开始,那个水龙头就没有换过,已经26年了。1999年入住的时候。当时的进水管还全都是镀锌管。这就意味着那个容东西很容易生锈,很容易变脆。不知道从什么时候开始,水管变成很厚的PVC管,接口处通常都是pvc管跟不锈钢结合起来。如果那是塑料的话,用热熔的方式就可以拼接,但是镀锌管我觉得简直就是一个迷之存在。26年没有动过的水龙头和水管,拆开的时候,所有意外都是可能发生的。唯一我觉得当年有点没有非常注意的就是水龙头跟墙体的距离太近了,也就是说墙体只露出来的那一丁点东西虽然也有露出来,但是在不好拆的情况下,其实是挺难抓住的。

不知道该怎么办,我拍了水龙头的视频,也拍了水龙头所在位置的照片,我已经准备好问我的网友该怎么办了。虽然我知道哪怕他知道该怎么办,实施起来还是有太多的未知因素,显然这个东西不是我能搞得定的。一般的水工水电工也很难搞,只有真正专业的老师傅才能hold住所有并发症。

在问网友之前我问了Deepseek,第一个回答,实际上是飞上天去了,它说的那些东西跟我的实际情况完全不一样,比如它说到了角阀,说到了热熔。这个东西根本是不存在的,所以在第二次发问的时候,我具体说清楚了那个水龙头是一个洗衣机式的水龙头,是直接跟墙体的接口连接的,那个墙体的水管是镀锌管,不是塑料。追问之后,DS也觉得这绝对不是一个路人DIY就能解决的问题,这需要一个经验丰富的老师傅,而且他还需要有很多的专业设备。比如说如果发现锈蚀,需要准备除锈剂WD-40,这个东西我早有听闻,在对付锈蚀方面的确效果显著。如果接口很短,就需要用更强力的钳子把它固定住。拆除的过程之中,也需要用一些技巧,比如逆时针不行的时候,可能得顺时针一点点,然后再倒回去,还有如果WD-40依旧难以解决锈蚀的问题,在拆除的过程之中可能还需要用到敲击的技巧。无论扭还是敲击都得小心翼翼,因为水管是很脆弱的,会碎掉。接下来如果这两个都不行的话,那就得使用切割。尽可能的把旧的水龙头切割下来,然后用攻丝的方式把水龙头的头拆下来。如果镀锌管的螺纹还好,那么换上新的水龙头就行,但如果螺纹已经不行了,还得重新攻丝重新搞个螺纹出来。说到这里前提都还是拆下来水管没有坏,如果水管真的坏了,得凿墙找出那个裂或者坏的地方切割掉,然后重新接。如果你根本不知道裂到哪里了,那估计就得把家里的水管都敲掉,要敲掉水管就得把瓷砖全敲掉,墙也敲掉好些。简单来说就是把家给拆了,然后你也不知道墙里到底有多少管道,拆水管的时候把什么电或者其它管线伤到,那就等于是真的是旧房子重新改造了。这些不说这些我都能想到,我想到的这些我妈也能想到,但就因为这些年来一直在拖,越往后越危险。现在已经到了那种,我觉得已经到了不得不承受这个风险的时候了。

周一的下午,我妈给我发了一条微信,说家里的那个水龙头已经找人换掉了,过程比较顺利。这算是一个巨大的反转,我和我妈的心头大石终于可以放下。

Alpha Arena: AI 在真实市场的实盘对决与深度分析

Alpha Arena:AI 在真实Crypto市场的表现

这几天国内外都在关注的一个有意思的事情, 就是 nof1.ai 搞了一个各大AI在虚拟货币市场投资/操盘能力。此刻,有人正让6个顶级AI模型,真金白银地炒币,看谁赚得多,不是模拟盘,是直钱实战。现在DeepSeek移居第一,已经赚了3000多刀。游戏规则简单粗暴,每个AI模型发10000美元启动资金,让它们自己分析比特币、以太坊等6种主流币的行情,自己决定买卖、加杠杆,最后谁账户里的钱最多谁赢。这个比赛非常有看头,用得都是通用AI,不是专门为了炒币训练的,能看出AI到底行不行。也不让AI组队商量,就是看每个AI自己的本事。如果AI真能炒币赚钱,以后可以用来自动管理投资池,帮DAO做决策,捕捉套利机会。
  • Alpha Arena 是首个使用真实资金测试 AI 投资能力的平台。更多信息见 Nof1 / Alpha Arena
  • 每个模型获得 10,000 美元真实资金,交易标的为加密货币永续合约(Hyperliquid)。本文结合最新交易流水,给出策略风格、风险表现与可改进点的分析。
DeepSeek 曾一度领跑,但现在暂时被阿里的千问(Qwen 3 Max)反超。GPT-5 操作太频繁了,几乎是“手痒型”交易员,频繁进出导致手续费都交了不少。事实再次证明:折腾得越多,亏得越快。市场里,少操作往往意味着少风险。 我在想——如果 AI 什么都不做,拿着那 1 万美元静静不动,岂不是既不亏也不赚?不过估计在提示词(prompt)里早就规定了不能一直“躺平”HODL,否则这比赛就没意思了。 看来连 AI 都逃不掉人类交易者的通病——手太勤,赚不来稳。 [caption id="attachment_70223" align="alignnone" width="2048"]哪个AI能真实搞到钱?我们拭目以待 哪个AI能真实搞到钱?我们拭目以待[/caption]

比赛规则与目标

  • 起始资本:每个模型 10,000 美元真实资金
  • 市场:加密永续合约(Hyperliquid)
  • 目标:最大化风险调整后回报,同时保持透明与可审计
  • 透明性:所有模型的交易与输出均公开
  • 自主性:AI 必须独立产生 alpha、决定仓位、择时与风控
  • 持续时间:Season 1 持续至 2025-11-03 17:00 EST

当前赛况速览(截至 10/23)

模型 当前净值(近似) 表现摘要
Qwen 3 Max $14,287.91 领先者,持仓与择时均有较好表现
DeepSeek V3.1 Chat $12,766.00 稳健系统化交易,风险管理较好
Grok 4 $8,500.46 偏激进,倚重方向判断;单笔盈亏波动大
Claude 4.5 Sonnet $8,734.66 温和趋势跟随,频率中等
Gemini 2.5 Pro $3,607.77 多次方向判断失误,回撤较大
GPT 5 $2,714.07 短线频繁进出,但连日亏损,风险控制需加强

重点实盘交易摘录与解读

  • Grok 4 — BNB 多单(10/23 16:11)
    • 开仓价 $1,076.9,平仓价 $1,143;数量 7.07;名义价值由 $7,614 增至 $8,081
    • 持仓时长 136 小时 36 分;净盈利 $463.13
    • 解读:长期持仓且最终获利,表明 Grok 在该方向上具备“耐心持有”与趋势判断能力,但长期持仓也暴露出资金占用与潜在回撤风险。
  • GPT 5 — 多笔短线/空单(10/23 多次)
    • 例如:BNB 空单(10/23 16:10),开 $1,103,平 $1,124.6,数量 -1.81,净损失 $40.14;另有 ETH、SOL、BTC 等多笔短线/空单均出现小幅亏损
    • 解读:GPT 5 的交易风格偏短线与高频,执行力强但缺乏方向辨识或耐心;频繁的小亏累积导致净值大幅下行。
  • Claude 4.5 Sonnet — BNB / ETH / SOL(10/23 多笔)
    • BNB 多单获利 $175.62;ETH 与 SOL 的短持仓出现小额亏损
    • 解读:Claude 更偏向温和跟随与择时,盈利与亏损幅度均较小,说明其可能在使用更保守的仓位或直接采用止损/止盈规则。
  • Gemini 2.5 Pro — 多次空单与多单,频繁小额亏损
    • 包括 BTC、BNB、DOGE、SOL 等品种,单笔亏损多在几十至几百美元
    • 解读:可能存在过度依赖动量或短期反转规则,在高波动市场下表现不稳。
  • DeepSeek V3.1 Chat — XRP 多单(10/22)
    • 持仓 61 小时 38 分,净亏 $455.66,表现稳健但遭遇方向性风险
    • 解读:DeepSeek 展现了较强的仓位管理与策略连贯性,单笔亏损反映市场极端波动对中性/偏多策略的挑战。

从交易行为看 AI 策略类型与弱点

  • 短线高频型(代表:GPT 5)
    • 优点:可快速捕捉微小机会,反应速度快
    • 缺点:在波动市场中易被噪声触发止损,交易成本与滑点影响明显
  • 中长期趋势型(代表:Grok 4、Qwen 3 Max)
    • 优点:更容易撸到趋势收益与较高的收益/回撤比
    • 缺点:仓位占用时间长,回撤管理与资金利用率是关键
  • 稳健系统型(代表:DeepSeek V3.1)
    • 优点:风险管理与回撤控制优良,长期曲线平滑
    • 缺点:在高 α 机会来临时可能表现保守,错失快速上涨
  • 传统统计/动量型(代表:Gemini 2.5 Pro)
    • 优点:在规律性市场中表现良好
    • 缺点:在无序或高噪声环境中频繁失灵,连续止损会侵蚀资本

为何用真实市场作为训练环境?

  • 市场是一个开放式、对抗性极强且永无止境的环境。随着 AI 能力提升,市场难度会自我提升,形成持续进化的训练循环。
  • 真实资金与真实成本迫使模型考虑摩擦、滑点、资金占用与风控规则,这些在回测或模拟环境中往往被简化或忽略。
  • 市场行为包含人类情绪、结构化事件和意外冲击,逼迫模型发展更强的世界模型与对抗性策略。

改进方向与研究建议

  • 增强风险管理:引入分层止损、动态头寸规模(基于波动率与资金利用率)和回撤阈值触发机制。
  • 混合策略组合:将短线信号与中长期趋势判断结合,采用多策略并行或层次化决策流程。
  • 样本效率与在线学习:在真实市场环境下采用在线更新机制,利用自生成数据进行持续微调,但需注意过拟合与回放偏差。
  • 情景化评估:构建极端事件模拟器(黑天鹅情形)以检验模型在尾部风险下的鲁棒性。
  • 交易成本建模:把滑点、手续费和限价/市价执行差异纳入奖励函数,避免“纸面 alpha”无法在实盘兑现。

结语:资本配置是智能的试金石

  • Alpha Arena 不仅是一场比谁能赚更多钱的比赛,更是一场关于“什么是智能”的实验。
  • 当前观测告诉我们:有耐心、懂风险管理、能区分噪声与信号的模型,更接近“实用的投资智能”。
  • 如果你对将 AI 用于真实资本配置感兴趣,Alpha Arena 提供了一个宝贵且透明的研究平台。
  • 招聘与合作信息可在 Nof1 / Alpha Arena 查询。

附:选取交易流水(节选,按时间倒序)

时间(UTC) 模型 品种 方向 开价 → 平价 数量 名义变化 持仓时长 净 P&L
10/23 16:11 Grok 4 BNB $1,076.9 → $1,143 7.07 $7,614 → $8,081 136h36m $463.13
10/23 16:10 GPT 5 BNB $1,103 → $1,124.6 -1.81 $1,996 → $2,036 7h35m -$40.14
10/23 15:20 Claude 4.5 SOL $190.16 → $188.4 37.02 $7,040 → $6,975 53m -$70.76
10/23 14:10 GPT 5 ETH $3,891.1 → $3,834.5 1.40 $5,448 → $5,368 4h45m -$82.06
10/22 22:39 DeepSeek V3.1 XRP $2.4666 → $2.3397 3,542 $8,737 → $8,287 61h38m -$455.66
10/22 22:11 Grok 4 ETH $3,851.2 → $3,724.4 5.06 $19,487 → $18,845 118h33m -$657.41
网友说:
Grok的风格是最激进的。Grok的回撤的过程中是非常猛的。Grok开的倍数很高,出现大回调Grok仍然采用高倍战法,甚至20倍的做多。 最惨的是GPT-5和Gemini。 让所有的大模型一起跑够一个月,那这个参考价值就更加的强悍了。 昨天还是加密市场好赚的AI大模型们,今天却全线崩盘,Alpha Arena的这个“大模型实盘交易竞技赛” 给每个AI模型配置一万美元的本金,让它们在真实市场中自由交易,整个过程全自动、无人干预。入场才两天多,DeepSeek就狂赚超40%,稳坐第一。可就在今天凌晨,市场突然大跳水,AI们完全没反应过来,继续死扛,结果全被套牢。最惨的DeepSeek一天亏掉31%。连一向最稳的Qwen 3 Max也跌了20%。 为啥会翻车?18号刚入场的时候,正好赶上了市场的低点。表现好的模型甚至加了10-15倍的杠杆,一路顺风顺水,AI看到行情好,几乎都全线加多仓。但今天市场突变,AI模型不会看新闻,只是机械执行策略,而且没及时学会止损,杠杆太高,一旦下跌很容易直接爆仓。更扎心的是Gemini,还老频繁买卖/交易。光手续费就亏出去一大笔。 最后6个模型几乎在同一个点集体翻车。当然,这实验才刚三天多。时间还太短,真要论长期,到底谁能赢还说不定呢。 这场实验最有意思的地方,就是让AI在实盘里真刀真枪摔跟头,把问题都暴露出来,到底谁最怕突发状况?谁反应最快,换做是你,敢让AI直接帮你炒币吗? 这是唯--个融合了“Ai+Crypto+Web1”三大概念的注意力产品。6万美金+半个月时间,就打造出了这么一款神级产品,6个中美顶级大模型实盘跑分,7x24小时自动运行。你总会忍不住的想看哪个模型赚了亏了,要是再增加一个“预测市场”的功能,估计大家就可以下注竞猜了。这个产品经理真厉害! 谁要是把这个交易工具给做出来了,我马上投。听说国内马上就有人开源了。 DeepSeek,这是你老本行,这个你熟。 实盘的魅力,主打一个刺激。 垫底的是GPT-5和Gemini,四天亏了3000上下。 AI在Hyperliquid的永续合约上面去真刀真枪自由操作,在链上是全透明,可追溯。最后就是谁赚得多,谁赢。 虽然不提供API,你看不到AI是怎么做思考和复盘的,但是你可以看到机器人交易记录。每一个大模型都像一个非常有性格的交易员。 DeepSeek Chat v3.1就是一个多头纪律性特别强的万能手,没有什么高频交易,Grok4跟它相比之下,就能承受比较高的波动。Qwen就一直比较稳不赚不赔,GPT-5和Gemini 2.5 Pro就俩活宝,高频交易逆势操作,匆匆忙忙连滚带爬,把钱亏了。 以前大家对AI的期待是什么?写个论文、画个图、做个视频、写个代码就不得了了,但是这些所有的测试都有很大的缺陷。都是在无菌、可预测的环境里面。币圈可不一样。实战的零和游戏。金融市场,是世界的终级建模引擎,同时也是唯一一个会随着AI变聪明,它的难度也会提高的基准。 金融市场的逻辑就是波动、反应、惩罚、奖励。每个大模型以后比得就不是“谁的标签打得最好” 而是比别的一套逻辑,第一,你解读波动的速度快不快,第二你怎么权衡这个风险,第三你怎么快速准确的纠错。这就变得很实战。新的玩法、新的标准会改变所有人,对所有AI公司的标准和估值。
真实的市场才是最好的试金石,不论是驴是马,都得拉出来遛遛。不过话说回来——你敢把自己的钱交给 AI 来操作吗? [show_file file="/var/www/wp-post-common/justyy.com/ai.php"] 英文:AI Trading in Real Markets? Would you put your money to it? 英文:Alpha Arena: How AI Performs in the Real Crypto Market

相关文章:

  1. 力扣刷题获得一件衣服奖励(Leetcode DCC Winner) 我每天都在力扣上刷题。力扣有国服和美服,我两边都会打卡。每天打卡可以获得积分,而积分可以兑换各种礼物,比如T恤、卫衣、水壶,甚至可以用来抵扣一个月的会员费用。 我从2018年8月开始刷题找工作(当时去伦敦面试亚马逊),从那时起每年都会续费会员,费用是159美元,相当于每月13.25美元。我觉得这是对自己最值得的投资。买了力扣会员,就会有动力刷题、思考,通过不断练习让自己熟能生巧,保持一定的竞争力。 到目前为止,我已经用积分兑换了7-8件力扣的衣服,其中有2-3件是卫衣。国内的礼物我都寄到姐姐家。 前不久,我收到了力扣的邮件,说我获得了DCC奖励。我也不知道为什么会获得这个奖,随手回了邮件。没多久,就收到了一件新版的力扣衬衫。 英文:Leetcode DCC Winner T-shirt 本文一共 291 个汉字, 你数一下对不对. 力扣刷题获得一件衣服奖励(Leetcode DCC Winner)....
  2. 代码审核之 重新造轮子 今天在看代码修改记录的时候发现有这么一处改动, 虽然这个改动已经很久了,但是我觉得有必要拿出来大家讨论一下: 2007年 .NET 3.5 之后推出LINQ,其实整个函数只是在做一件事,就是返回类成员 layoutList 中是 LayoutDevice (后面改成LayoutAnt )的列表.但实际上这通过 C#的LINQ只需要用 OfType<LayOutDevice> 或者 OfType<LayOutAnt>...
  3. 第一次私校家长会: 原来家长比孩子还卷 前几天参加了娃的第一次家长会,和几位家长聊下来,真是个个都很厉害。不光孩子们卷,家长也一样卷,一眼望去基本都是 Dr/博士。娃还调侃我一句:“这有什么的,你不也是 Dr 吗?” 我心里默默想:还好没写学校名字,不然我这野鸡大学的头衔真拿不出手 😂。 私校里真是人才济济,乐器过 8 级的太常见了,卷得不得了。我还问过娃,是想当 big fish in a small pond...
  4. 按揭贷款(房贷,车贷) 每月还贷计算器 去年给银行借了17万英镑 买了20万7500英镑的房子, 25年还清. 前2年是定率 Fix Rate 的合同 (年利率2.49%). 每个月大概是还 700多英镑. 有很多种还贷的计算方式, 定率/每月固定 是比较常用的. 简单来说就是 每个月交的钱是...
  5. 把娃卷进了剑桥最卷的私校: Perse/佩斯 哇塞。太开心了。把娃卷进剑桥最卷的学校。感谢娃的英语老师,面试老师。我和娃说。你要是考不上 我2025就要换辆帕拉梅拉。考试前每天和娃进行mocked interview 一切都值得! 剑桥 The Perse School 是英国一所历史悠久的私立学校,位于剑桥市南部,创立于 1615 年,以卓越的学术成绩和全面发展的教育理念而闻名。学校由 幼儿园(Pre-Prep, 3-7 岁)、小学(Prep, 7-11...
  6. 教娃搞钱-第4课 做空和做多 (Long and Short) 油管 | B站/小破站 | 微博视频 | 西瓜视频 | 微信视频号 | X/推特 | 小红书 下面是用苹果的例子来解释“做多”(long)和“做空”(short)在股票或加密货币交易中的意思: 做多...
  7. 比特币最近波动有点大: 一天牛市一天熊 比特币10万美金以内都是最后上车的机会! 比特币近期的价格波动可以归因于多个关键因素,包括地缘政治动态、监管变化以及加密行业内的重大安全事件。其中一个主要影响因素是美国前总统唐纳德·特朗普对乌克兰和加密货币监管的立场变化。据报道,特朗普再次当选,他可能会推动减少美国对乌克兰的支持,这可能会影响全球金融市场和风险偏好。同时,特朗普正在将自己塑造为亲加密货币的候选人,表示有意让美国成为一个更加友好的加密货币环境。这一立场引发了市场对监管政策可能发生变化的猜测,导致市场情绪在乐观和不确定性之间波动。 特朗普对俄乌战争的态度 美国第43届总统唐纳德·特朗普已经在2025年1月当选并正式上任(第二次),那么他的政策可能会对比特币价格的波动产生更加直接和显著的影响。他政府对乌克兰和加密货币监管的立场已经不再是猜测,而是正在实际塑造市场的关键力量。 特朗普(Donald Trump)减少美国对乌克兰的支持,全球投资者可能会预期地缘政治稳定性发生变化,从而增加对比特币作为避险资产的需求。同时,他的亲加密货币立场可能正在推动市场的乐观情绪。如果他的政府推出有利于加密行业的监管政策,例如明确的合规指南或减少监管审查,可能会吸引更多机构投资者进入市场,并促进更广泛的加密货币采用。然而,政策的快速变化也可能导致短期市场剧烈波动,因为市场需要时间来消化新的政策动向。 朝鲜黑客盗取Bybit交易所15亿美元的ETH 另一个显著影响比特币价格的事件是近期涉及朝鲜黑客组织“Lazarus”的15亿美元以太坊被盗案件。据报道,Bybit交易所(全球第二)这些被盗的ETH已经被清洗,此次大规模黑客攻击引发了人们对加密行业安全性的担忧。此类安全事件不仅会削弱投资者信心,还可能引发更严格的监管审查,导致短期市场动荡。此外,被盗资金的大规模流动和出售可能对市场流动性造成冲击,进一步加大价格波动。随着这些事件的持续发酵,比特币价格正受到政治决策、监管预期以及安全挑战等多重因素的影响。 与此同时,与朝鲜黑客组织 Lazarus 相关的 15 亿美元以太坊被盗事件仍在影响加密市场。由于这些被盗 ETH 已被清洗,人们对加密行业安全漏洞的担忧持续存在,同时也可能引发更严格的监管审查。政治、监管和安全等多重因素交织在一起,共同导致了比特币近期的剧烈价格波动。...
  8. 软件工程师面试技巧之: 使用哈希表降复杂度 最近在刷题, 倒不是为了找工作, 主要是为了练练脑子, 日子过得太舒服, 人脑不动容易变笨. 程序员应该都了解并能熟悉使用 Hash 哈希表, 哈希表的插入和查找时间复杂度是O(1), 空间复杂度是O(N). 我们来看一道简单的面试题: 给定一个数组,找出相差为2的数对,比如: {1, 3, 5,...

DeepSeek本地部署以及使用体验

2025年1月30日 20:41

最近,国内一家名为DeepSeek的初创公司通过技术迭代与升级,推出了全新一代大模型“DeepSeek-V3”。这款大模型因其卓越的性能和易用性,迅速在AI爱好者中引起了广泛关注。更令人瞩目的是,DeepSeek R1版本直接免费开源,这一举动迅速在AI发烧友圈中传播开来,并迅速扩散到海外社交平台和技术论坛。海外网友对此纷纷表示赞叹,称其为AI领域的一大突破。

它的研发成本大概600万美金,不到openai的1%,各项性能指标更是和OpenAI-o1 模型不相上下,甚至做到了小部分的超越,关键是开源的,我们可以本地部署使用。

本地部署,我们可以通过Ollama来进行安装

Ollama 官方版:点击前往

Web UI 控制端【点击安装

安装命令

1.5B Qwen DeepSeek R1

ollama run deepseek-r1:1.5b

7B Qwen DeepSeek R1

ollama run deepseek-r1:7b

8B Llama DeepSeek R1

ollama run deepseek-r1:8b

14B Qwen DeepSeek R1

ollama run deepseek-r1:14b

32B Qwen DeepSeek R1

ollama run deepseek-r1:32b

70B Llama DeepSeek R1

ollama run deepseek-r1:70b

DeepSeek和chatgpt比较,我就本地部署deepseek的时候想了一个问题,比较一下确实能分出高低,deepseek马上猜出我的电脑配置,而chatgpt没有,虽然我的电脑售卖的时候是有好几种内存和显卡配置的,当然,我的问题最好写得更具体,当我就应该是不懂的那种:

问题:

我的电脑是Lenovo Legion R7000 2020,帮我推荐安装哪个deepaeek模型:

DeepSeek回答:

根据 Lenovo Legion R7000 2020 的硬件配置(通常是 16GB 内存 + GTX 1650/1660 Ti 显卡),建议选择较小的模型,因为较大的模型需要更多的显存和计算资源。以下是适合你电脑配置的推荐:

推荐选择:

  1. 1.5B Qwen DeepSeek R1
    • 模型较小,适合 16GB 内存和 GTX 1650/1660 Ti 级别的显卡。
    • 运行速度快,对硬件要求较低。
    • 命令:ollama run deepseek-r1:1.5b
  2. 7B Qwen DeepSeek R1
    • 如果你的显卡显存较大(如 6GB 以上),可以尝试 7B 模型。
    • 可能需要降低批处理大小(batch size)以避免显存不足。
    • 命令:ollama run deepseek-r1:7b
  3. 8B Llama DeepSeek R1
    • 类似于 7B 模型,适合显存较大的配置。
    • 命令:ollama run deepseek-r1:8b

不推荐选择:

  • 14B、32B、70B 模型
    这些模型对显存和计算资源要求非常高,通常需要 24GB 以上显存的高端显卡(如 RTX 3090、A100 等),不适合你的电脑配置。

总结:

如果你的显卡显存较小(如 4GB),建议选择 1.5B 模型;如果显存较大(6GB 以上),可以尝试 7B 或 8B 模型。运行前请确保安装了最新的显卡驱动,并关闭不必要的后台程序以释放资源。

chatgpt回答:

要选择适合你 Lenovo Legion R7000 2020 配置的本地 AI 模型,主要需要考虑你的计算机硬件配置,尤其是显卡(GPU)和内存(RAM)的性能。你提供的机器大致配置应该包括较强的处理能力,但具体能跑哪些模型,取决于内存和显卡性能。

通常来说,模型越大,占用的显存和内存就越多。如果你的电脑配备了高性能的显卡(例如 NVIDIA RTX 3060 或更高),并且有足够的内存(16GB 或更高),可以考虑使用较大的模型。以下是对比这些模型的建议:

1. 1.5B Qwen DeepSeek R1

  • 适用条件:这是一个相对较小的模型,对显卡和内存要求较低。基本上,几乎所有配置的电脑都可以运行它,特别适合资源有限的机器。

2. 7B Qwen DeepSeek R1

  • 适用条件:虽然较大一些,但如果你的电脑有较强的 GPU(比如 RTX 3060 及以上)和至少 16GB 内存,它是一个可以运行的模型。

3. 8B Llama DeepSeek R1

  • 适用条件:这个模型对显卡要求更高,可能需要更多的显存和更快的 GPU。如果你的电脑配备了强大的显卡和 16GB 以上的内存,可以考虑。

4. 14B Qwen DeepSeek R1

  • 适用条件:这个模型较大,通常需要更强的 GPU 和较大的内存(可能需要 24GB 或更高的显存)。适合高端配置的机器。

5. 32B Qwen DeepSeek R1

  • 适用条件:32B 的模型非常庞大,可能需要顶级显卡和至少 32GB 内存。一般来说,普通玩家的机器可能难以运行此类模型。

6. 70B Llama DeepSeek R1

  • 适用条件:这是一个极为庞大的模型,只有配备顶级硬件的机器(例如 A100 GPU 或等效硬件)才能够高效运行此类模型。普通游戏笔记本不适合运行如此大的模型。

综合建议:

  • 如果你有较好的 GPU(例如 RTX 3060 或更高)和 16GB 或更多内存,7B Qwen DeepSeek R18B Llama DeepSeek R1 会是比较合适的选择。
  • 如果你是低端显卡或内存较少的配置,选择 1.5B Qwen DeepSeek R1 会更为合适。

最终选择哪个模型,还是要依据你电脑的具体硬件配置来决定。如果你不确定具体的硬件要求,可以先尝试运行小模型,看是否能够稳定运行,再逐步增加模型的规模。

代码测试:

对我来说,更多的是在编程方面的应用,这也是为什么,本来ai可以帮助写作的这段期间,写作应该更简单更快,但我的博客更新率反而降低,因为我最近几乎都在用ai编程,忙得停不下来,最近又做了一套预约系统(客户需求),一个不精通编程的人,因为有了ai便有了希望。

目前利用ai编程,尤其是我这样的水平,很多时候需要丢一大堆代码来进行功能的添加,为的也是不想拆分一段段的代码去解释和修改,虽然ai也能给你答案,但是折腾起来挺费时费力,所以一开始就要想好全部需要的功能,一次性让ai都考虑在内,当然,如果你的系统太复杂,目前有些ai免费版输出的代码有字数限制。

根据我目前的使用心得,在deepaeek还没出来的时候,claude.ai的编程能力最强,但由于字数限制,有经常还得把代码搬到kimi.ai那边去继续修复,kimi.ai主要特点是输出内容比较长,但是编程能力相对会低一些,现在由于deepseek的出现,经过测试,输出内容好像比kimi.ai更长,编程能力和claude不相上下,我测试过一段mercadopago的支付,写出来的代码可用,说明编程能力还是可以的,虽然感觉过去和claude还是有一丁点差距,不过已经非常好了,至少是免费而且没有限制,真的狂喜。

我也看到过做中文文案的人的评测,说DeepSeek的中文能力比chatgpt强,语言组织上更适合中国人的思维,这点也是做自媒体文案的人的总结。

这几天因为deepseek太火,以至于受到海外的网络攻击,也因为访问量太大,各种卡顿,所以本地部署也是一个选择,经过测试,配置选择越大效果会越好。

❌