Deepseek真面目
今天和几个专业人士一起讨论了大语言模型。具体来说是关于 DeepSeek 的。DeepSeek 是建立在开源技术基础上的,它巧妙地利用了开源算法,同时结合了 OpenAI 的数据来训练模型。这种方法有些取巧,但效果不错。然而,与 OpenAI、XAI 和 Google 的 Gemini 等模型相比,DeepSeek 的技术水平仍有明显差距。这些顶级模型不仅在算力上占据优势,其算法也更加先进,整体实力远远超过了 DeepSeek。
大家对 DeepSeek 的印象是:它用很少的成本训练出了效果不错的模型。不过,它的核心依赖于 Meta 的 Llama 模型,而 Llama 系列似乎已经接近技术的瓶颈。这是目前大家比较达成共识多的一个观点。#deepseek#nvdia #人工智能
大家对 DeepSeek 的印象是:它用很少的成本训练出了效果不错的模型。不过,它的核心依赖于 Meta 的 Llama 模型,而 Llama 系列似乎已经接近技术的瓶颈。这是目前大家比较达成共识多的一个观点。#deepseek#nvdia #人工智能