数码博主雷科技做了四轮测试,得到以下结论——常规问答★:简短整洁、可读性高;内容总结★★★:结果很精简,重点有缺失★★;数学题解答:快速、准确、有过程;金融问题答疑:精准理解,给出了适当建议。
1月13日,DeepSeek官方应用上线苹果App Store,结合两大核心功能:深度思考和联网搜索,支持用户完成对话、语言翻译、创意写作、编程★★★、解题、文献解读★、旅行规划等用途★★,比网页版多了“拍照识文字”功能★★★,但依然是免费的,被中外网友评价为★★★:ChatGPT最佳免费替代品之一。
而罗福莉曾在知乎发表对DeepSeek团队的评价:DeepSeek团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的。
测试结果显示,DeepSeek-V3总体能力与其他大模型相当★,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码任务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的任务中,DeepSeek-V3给出的代码注释★★★、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面★★,DeepSeek-V3并未展现出明显优于其他大模型之处。
网传上海一男子指着瘫痪父亲大骂★★:老**想死是不是★?再不醒过来接回家等死
政府工作报告★★★:城乡居民基础养老金最低标准再提高20元 适当提高退休人员基本养老金
就在DeepSeek在X平台被海外AI技术大牛发帖背书后,小米的一则挖角消息迅速在中文互联网刷屏——小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队★★。
2017年,幻方量化宣称实现投资策略全面AI化★★。2019年,其资金管理规模超100亿元,也一度是国内首家突破千亿私募的量化大厂。2023年5月,梁文锋实控的AI研发机构北京“深度求索”成立★,次年DeepSeek正式上线。
DeepSeek团队最大的特点就是年轻★★。应届生、在读生,特别是来自清北的应届生在其中非常活跃。他们中的一些人,2024年一边在DeepSeek搞研究,另一边新鲜热乎的博士学位论文刚评上奖。
最后,他总结说★★★,对于以文字生成为主要需求的用户来说,DeepSeek-V3是一款不错的AI大模型,但若有更多需求,如写长篇小说、创作图片、投资计算★,豆包、Kimi等免费服务的AI大模型及其提供的智能体或许更合适。
更难得的是★★,有数据显示,OpenAI GPT-4训练成本高达6300万美元,而DeepSeek-V3成本只有其十分之一不到。
特别声明★:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务★★。
公开信息显示,DeepSeek V3模型的训练是在2000块英伟达H800 GPU上完成的★,这一数量远低于硅谷大厂普遍使用的几十万块更高性能的GPU★★★。这一成就打破了算力芯片对国产大模型的限制瓶颈,为创业团队提供了新的解法★★:即便在算力有限的情况下,使用高质量数据和更好的算法,同样能训练出高性能大模型。
交通运输部部长★★★:中国高铁、中国路★、中国桥、中国港和中国快递都已经成为亮丽的中国名片★★。
苹果公司解释为何新 Mac Studio 没有配备 M4 Ultra 芯片
新快报讯 记者郑志辉报道 中国AI业界开年最振奋人心的一则消息,莫过于杭州大模型创业公司“深度求索”DeepSeek发布的最新V3开源模型,评测成绩不仅超越了Qwen2.5-72B(阿里自研大模型)和Llama 3.1-405B(Meta自研大模型)等当前领先开源模型,甚至能和GPT-4o、Claude 3.5-Sonnet(Anthropic自研大模型)等顶级闭源模型掰掰手腕。
苹果推出配备M4 Max和M3 Ultra芯片的新款Mac Studio
DeepSeek的母公司是梁文锋在2015年创立、量化基金起家的幻方量化。80后梁文锋本科、研究生都就读于浙江大学,拥有信息与电子工程学系本科和硕士学位★★。
在DeepSeek V3的一夜成名后★★,广发证券计算机行业分析师发布研报称★:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑★、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包★、Kimi以及通义千问大模型生成的结果进行比较。★”