不要过分神话DeepSeek

关注

满屏都在盛赞DeepSeek,甚至《黑神话悟空》的主创冯骥都表示“DeepSeek是国运级别的科技成果”。

  2025年1月27日,DeepSeek更是超越ChatGPT,登顶苹果美国区免费App下载排行榜第一。

  有一说一,DeepSeek确实好,开源免费、简单小巧、训练成本低都是优点,而且会给出看似缜密的推理过程。

  DeepSeek有多好,举个例子,假如我们现在把“我是脱口秀演员何广智,请你模仿我的风格,给我写吃饭的段子,需要讲够5分钟”这个问题丢给主流的几家国产大模型,没有哪家比DeepSeek回答得更好

  不过DeepSeek也有一些明显的不足,现在阶段还不能过高评价。

 1、套路化、公式化的创作,AI味还是很浓

  我们阅读文章时,经常会说这是华尔街体、虎嗅体一样,有很明显的创作特征。这种明显的特征被机器学习利用后,机器会把这种特征规则化、套路化,最终呈现的内容看起来非常专业严谨,却反而暴露出机器短板--一看就是机器创作。

  DeepSeek的创作也是如此,充斥着更严谨的套路化创作。它呈现内容真的太好了,有人说“它比人还好”,这不完全是一句褒义词,另外一层含义是,看起来还是像机器写的。

  当然,这一点要比国家其他大模型好很多。

 2、低级错误频发,无法对呈现内容自我校准

  前两年,主流大模型出现过“林黛玉倒拔垂杨柳”之类的张冠李戴的错误。现在虽然有所改进,但各种低级错误频发,且一本正经呈现的案例也时有发生。

  DeepSeek也不例外,这几天我在使用时发现了大量的错误呈现。在我提问关于“丁道师”的内容,发现了大量非常低级的错误,这些错误按理说很容易识别,但DeepSeek还是执拗地给出了自己的答案。

  比如这句话:“您提到的“丁道师”应是中国互联网行业资深分析师、知名科技评论人丁道师(本名丁磊),他在互联网经济、电商、新媒体等领域有长期观察和研究。”

  实则丁道师并非丁磊,如此混淆,实在不该。

  3、对因果关系理解欠佳

  之前有位大佬提到过一个假设,大意是“如果我们现在到处发文章和论文,论证人可以把石头当饭吃,长期以往,机器就以为人可以把石头当饭吃,可能就会输出这样的内容。”

  现在国内的几家大模型服务,包括DeepSeek也遇到这个问题。

  比如这个论述“吕梁被评为中国电商扶贫示范市”,吕梁其实从来都没有被评为中国电商扶贫示范市,咱们国家也没有这样一个评选。

  这种因果关系的错乱,是这样导致的:有作者认为吕梁可以作为一个电商扶贫示范市看待,并且把这个论述发到了多种权威媒体。结果现在被DeepSeek一通深度推理过后,就变成了“吕梁被评为中国电商扶贫示范市”。

  写在最后:总而言之,以理性的眼光看待 DeepSeek 的成果至关重要。须知,任何科技创新都需遵循科技发展的一般规律,DeepSeek 自然也不例外。

反馈
联系我们
推荐订阅