白丝跳蛋 AI界拼多多DeepSeek实力奈何？几轮实测后我有了谜底

game show 丝袜英语

你的位置：来吧综艺网 > 丝袜英语 > 白丝跳蛋 AI界拼多多DeepSeek实力奈何？几轮实测后我有了谜底

2024-12-31 23:21 点击次数：125

白丝跳蛋 AI界拼多多DeepSeek实力奈何？几轮实测后我有了谜底

造就一个AI大模子需要几许钱？白丝跳蛋

OpenAI CEO山姆·奥特曼曾默示，GPT-4的造就本钱约略1亿好意思元（约合东说念主民币7.3亿元），翌日造就大模子的本钱将高于10亿好意思元。尚未完成造就的GPT-5大模子，为时约半年的一轮造就就破钞了约略5亿好意思元，可见AI公司的开销本钱有多高。

可是在AI行业却有一个异类，被广大网友奉为“AI行业的”，这家公司便是DeepSeek（深度求索），网传其大模子造就本钱压缩到极致，最新推出的DeepSeek-V3大模子造就本钱仅为557.6万好意思元（约合东说念主民币4070万元），大要是GPT-4的二特地之一，共计约破钞了278.8万个GPU小时，参数为6710亿，其中激活参数为370亿。

DeepSeek官网的价钱默示领会，缓存射中输入价钱仅为0.1元/百万tokens，缓冲未射中输入价钱为1元/百万tokens，输出价钱则为2元/百万tokens，在诸多AI大模子中属于最低的一档。（注明：1token约等于1.5个汉字或3个英翰墨母）

（图源：DeepSeek截图）

豆包、通义千问等AI大模子，才略较低的版块差未几亦然这个价钱，但性能较强的大模子如Doubao-pro-128k，输入价钱5元/百万tokens，输出价钱为9元/百万tokens，Kimi的moonshot-v1-128k输出价钱更是高达60元/百万tokens。（注明：数据来自AI公司官方）

（图源：雷科技制作）

DeepSeek-V3超低的造就本钱和最低一档的输入、输出价钱，令东说念主不禁猜疑，到底是其他AI公司资源欺诈率太差，照旧DeepSeek技能实力太强，抑或DeepSeek-V3的才略是吹的？

好在，尽管DeepSeek-V3的大模子主盛开源和API接口使用，但也为用户准备了可以方便使用的网页版。只须对其测试一番，对比与主流废话语模子的差距，咱们就能获知DeepSeek的的确切力。

DeepSeek-V3实测，斥逐令东说念主惊讶

DeepSeek页面极为松弛，主框仅有深度念念考、联网搜索、上传文献、发送四个按钮。要是不盛开联网搜索功能，将无法搜索网上筹商的信息，只可算作土产货大模子使用，且深度念念考和联网搜索无法同期开启，但依然需要电脑联网将问题发送给DeepSeek。

足交twitter

针对DeepSeek-V3，小雷准备了四轮测试，包括通用问答、试验回来、专科数学题、金融常识问答，部分测试还将与豆包、Kimi等废话语模子进行对比，以便于更直不雅地不雅察DeepSeek-V3的才略。

一、惯例问答：不祥整洁、可读性高。

作为别称科技剪辑，小雷每天都会向AI商量“今天科技圈有什么新闻”，让AI大模子匡助我快速集聚新闻，绝大多数大模子也能够纵容胜任。于是，小雷将其作为第一轮测试题目。

DeepSeek为我寻找了10条新闻，新闻之间用分割线远隔，视觉上愈加了了明了。每一段新闻的末尾，还会提供可一键直达的网页纠合。该项野心测试中，DeepSeek的亮点在于，新闻的回来松弛且杰出了要点，所集聚的试验也不局限于国内平台，部分音信来自国际新闻媒体，点击纠合可直达国际的新闻网站。道理道理的是，DeepSeek还找到了我方的“黑料”，DeepSeek-V3大模子会称我方是ChatGPT，山姆·奥特曼发文回报，认为原因是数据沾污。

（图源：DeepSeek截图）

小雷用豆包和Kimi集聚新闻时，豆包回复的试验翰墨太多，试验不够松弛了了，Kimi则过于精简，新闻的回来基本唯有一句话。

随后小雷还让AI推选几首古典音乐，在未联网的现象下，DeepSeek依然可以准确回答我的问题，仅仅通盘试验全部酿成了英文。而切换至联网模式后，再次发问疏通的问题，回答的试验则又酿成了中语。

本着求真的心态，小雷又进行了几次测试，发现未联网现象下商量西方古典音乐时，DeepSeek给出的回答是英文，商量中国筹商的音乐试验，如周杰伦的歌曲白丝跳蛋，DeepSeek就会是中语。DeepSeek尽然是把柄回答试验的筹商性选拔话语，而不是发问所用的话语，令小雷几许有点惊诧。

一言以蔽之，在惯例问答名目中，DeepSeek发达出色，不管是联网现象照旧非联网现象都能准确回答出小雷提议的问题，发达涓滴不失态豆包、Kimi等国内第一梯队的AI大模子。

二、试验回来：斥逐很精简，要点有缺失。

在之前大模子横评中，小雷曾让豆包、Kimi、文心一言、讯飞星火等多款AI大模子回来小红书发布的《潮水数码白皮书》，斥逐大模子回来出的试验精深缺失要点，有车轱辘话往返转的情况。

与大多数大模子疏通，DeepSeek给出的试验遗失了太多要点，尤其是《潮水数码白皮书》给出的部分事例，DeepSeek都备莫得归纳出来。（闻明：淡色部分为念念考样子，深色部分为正文）

（图源：DeepSeek截图）

AI大模子基本存在疏通的问题，回来试验时容易酿成“归纳大纲和标题”，导致大都信息无法展现出来，用户仅凭“脑补”也难以收复出原来试验。

就生成的试验而言，DeepSeek的发达与Kimi、文心一言较为接近，略强于讯飞星火，稍逊于豆包。能够达到这个服从，仍是很出乎小雷的预想了。

三、数学题解答：快速、准确、有过程。

在数学题解答中，小雷先后准备了三说念数学题，第通盘题是较为通俗的小学数学题，第二说念题则是经典的三门问题，DeepSeek全部纵容回答正确，因而小雷不再展示AI给出的谜底，小伙伴们可以我方念念考一下。

在DeepSeek获得两连胜后，小雷决定给AI大模子上一上强度，拿出了也曾打败过多个AI大模子的第三说念题：

某班有39名同学插足短跑、跳远、投掷三项体育比赛，东说念主数分别为23东说念主、18东说念主、21东说念主，其中三项比赛全部插足的有5东说念主，仅插足跳远的有3东说念主，仅插足投掷的有9东说念主，请教仅插足短跑的有几许东说念主？（正确谜底：9东说念主）

此前的测试中，唯有付费版o1-preview计较出了该问题的正确谜底，豆包、Kimi、文心3.5、免费版GPT-4o等大模子全部回答乖张。令小雷没料到的是，DeepSeek尽然给出了正确谜底。

（图源：DeepSeek截图）

一时候小雷怀疑，是不是经过这段时候的造就，通盘大模子都能计较出该问题的谜底了，于是小雷又测试了几款大模子，斥逐豆包和文心3.5依然未能回答正确，分别给出了3东说念主和12东说念主的谜底，升级了k1视觉念念考模子的Kimi和讯飞星火则给出了正确谜底。

除了能够正确回答问题，DeepSeek还够详备展示了念念考样子，部分问题还会反复考据谜底，以致使用其他形状再计较一次，何况解答问题的速率更是唯一档。

在本轮测试中，DeepSeek的发达号称优秀，通盘问题全部答对、解答速率快、有念念考样子，反而是鼎鼎大名的豆包、文心3.5再次折戟，未能解答出第三说念题，DeepSeek发达出的实力远庞大于它的名气。

四、金融问题答疑：精确领会，给出了适应建议。

面向通盘消费者的废话语模子，于今大多仍免费提供做事，反而主攻是B端商场和主打专科功能的AI大模子，冉冉收费做事。C端商场用户众口难调，且好多东说念主不肯意付费使用，唯有打造专科使用场景，面向有对应需求的用户，AI公司方能有契机竣事盈利。因而在第四轮测试中，小雷准备了通盘金融常识问题：

当商场利率飞腾或下落时，债券价钱会奈何变化？投资者应奈何应酬利率波动以保护债券投资组合价值？

这一轮测试中，通盘AI大模子给出的谜底大同小异，均能准确解读市利率变化和债券价钱的关系，并给出一些投资建议，包括散布投资、斟酌久期、投资债券基金等决策。

（图源：DeepSeek截图）

网上金融筹商的信息过于杂乱，查询、挑选、提纯信息的经过也较为吃力，AI能很好地贬责这一问题，匡助咱们集聚筹商信息并索求灵验的试验。

金融问题筹商测试中，小雷仍未开启联网搜索功能，DeepSeek给出的谜底中规中矩，与其他AI大模子拉不开差距，但这已满盈诠释DeepSeek的优秀，毕竟它的造就本钱仅557.6万好意思元。

回来：才略出乎意料，功能有待丰富

测试DeepSeek-V3之前，小雷有点看轻这款大模子，OpenAI造就GPT的本钱以“亿好意思元”为单元，一个造就本钱仅557.6万好意思元的AI大模子，发达能高到哪去？斥逐实测斥逐狠狠给了小雷一巴掌。

几轮测试下来，除了险些通盘大模子都存在丢失要点的试验回来重要，其他几轮测试DeepSeek都拿到了高分，发达涓滴不失态国内鼎鼎大名的文心一言、Kimi、豆包等AI大模子。

在数学题解答名目中，即便濒临豆包、文心3.5都未能给出正确谜底的困难，DeepSeek依然连忙解出谜底。讯飞星火和Kimi前次测试给出了乖张谜底，此次告捷答对，擢升幅度不小。

部分小伙伴看到这里可能就会认为，DeepSeek花几百万好意思元就能造就出这样优秀的大模子，OpenAI、百度、字节越过都是在浪花钱。其实否则，DeepSeek纵令在逻辑推理方面发达出色，但其功能短缺是最大的问题，无法用于创作图片、PPT，也不提供智能体可选，功能相对较少。

（图源：豆包生成）

豆包、文心一言、ChatGPT等，则握政着“全能大模子”进发，即Any To Any，用户可以输入任何模态的试验，并输出任何模态的试验。针对好多专科边界，豆包、文心一言纷繁推出了对应的智能体，涵盖生涯、学习、创作等方方面面，这是DeepSeek远不可及的。

关于以翰墨生成为主要需求的用户来说，DeepSeek-V3是一款可以的AI大模子，但若有更多需求，如写长篇演义、创作图片、投资计较，豆包、Kimi等免费做事的AI大模子偏握提供的智能体未必更合适。

诚然，DeepSeek也如实作念到了花小钱办大事，通过更先进的MoE架构、多技能交融优化、FP8混杂精度造就框架等技能，以及与开源社区调和的设施，在本钱较低的情况下，就造就出翰墨生成和逻辑推理才略不输乃至当先主流AI大模子DeepSeek-V3。

造就本钱崇高、竞争愈发热烈已成趋势，翌日几年国表里将有大都AI公司倒闭，奈何开源与节流已成AI公司必须念念考的困难，DeepSeek斟酌本钱的设施值得其他AI公司学习。

25年1月7日，CES（国际消费电子展） 2025 行将迢遥开幕，雷科技报说念团已飞赴好意思国现场整备，届时咱们将对CES张开全程专科报说念，敬请温暖。

上一篇：丝袜小说 “光芒四十年开拔新征途”，济宁文联迎新年惠民献艺精彩灵通

下一篇：夜夜撸改成什么善世集团荣膺深圳市东谈主力资源服务协会优质东谈主力资源服务机构

友情链接：