AI在线 AI在线

日本AI专家评DeepSeek:中国AI新星崛起,技术实力接近OpenAI

中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI大规模语言模型(LLM)近日引发全球关注。 日本AI研究领域的权威、东京大学教授松尾丰在接受日本经济新闻采访时,对DeepSeek的技术水平、开源战略及其对日本企业的影响进行了深入分析。   松尾丰表示,DeepSeek的技术非常出色,其性能与美国OpenAI开发的ChatGPT接近。

中国初创企业DeepSeek(深度求索)开发的高性能、低成本生成式AI大规模语言模型(LLM)近日引发全球关注。日本AI研究领域的权威、东京大学教授松尾丰在接受日本经济新闻采访时,对DeepSeek的技术水平、开源战略及其对日本企业的影响进行了深入分析。  

松尾丰表示,DeepSeek的技术非常出色,其性能与美国OpenAI开发的ChatGPT接近。他指出,DeepSeek每次发布新模型时都会发布详细的技术论文,展示其在模型优化方面的创新之处。例如,今年1月发布的最新模型“R1”通过强化学习提升了推理能力,达到了与OpenAI“o1”模型相当的水平。  

DeepSeek

松尾丰认为,中国的AI开发水平已经与美国比肩,甚至在某些方面超越了美国。他指出,中国不仅有阿里巴巴、腾讯、百度等科技巨头,还拥有大量优秀工程师,形成了活跃的AI生态系统。DeepSeek在这样的环境中崛起并不令人意外,并可能进一步改变全球AI竞争的势力格局。  

松尾丰强调,DeepSeek的成功为日本初创企业提供了重要启示。作为一家非大型科技企业,DeepSeek凭借扎实的技术开发实现了世界领先的精度。这表明,即便在日本,只要专注于技术创新,企业同样有机会在AI领域取得突破。  

DeepSeek采取了开源战略,这一做法与Meta和阿里巴巴等企业类似。松尾丰指出,开源模型为全球开发者提供了强大的基础,使追加学习和性能提升变得更加容易。他认为,DeepSeek的出现增强了开源势力的影响力,尽管非公开模型(如OpenAI和谷歌的产品)仍具备竞争优势,但开源模型在特定场景下同样能够实现卓越性能。  

关于AI模型的安全风险,松尾丰表示,风险因使用方式而异。开源模型可以在本地运行,避免了数据外泄的风险;而使用在线服务时,数据会发送到服务器进行处理。他强调,无论是DeepSeek还是OpenAI,用户都需要对服务提供方保持信任,因为数据的使用和学习难以完全排除。  

相关资讯

DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练革命

今日,国内人工智能领军企业DeepSeek正式公开其开源计划的第四日成果——Optimized Parallelism Strategies(优化并行策略),重点推出双向管道并行算法DualPipe、专家并行负载均衡器EPLB,以及对计算-通信重叠机制的深度优化。 此次技术升级直击大规模语言模型训练的核心痛点,为超万卡级集群的高效运行提供了全新解决方案。 DualPipe:双向管道并行算法作为本次升级的核心技术之一,DualPipe专为V3/R1架构设计,通过创新的双向数据流管道,实现计算与通信的高度重叠。
2/27/2025 10:45:00 AM
AI在线

谷歌 AI 发布 TxGemma:全新大规模语言模型助力药物开发

药物开发是一个复杂且成本高昂的过程,伴随着高失败率和漫长的开发周期。 传统的药物发现过程需要从靶点识别到临床试验的各个阶段进行大量的实验验证,这往往消耗大量的时间和资源。 然而,随着计算方法,特别是机器学习和预测建模的兴起,这一过程有望得到优化。
3/28/2025 2:32:00 PM
AI在线

AWS 发布 SWE-PolyBench:评估 AI 编程助手的新开源基准

近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。 随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。 然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。
4/24/2025 10:01:16 AM
AI在线
  • 1