应用
前OpenAI首席技术官穆拉蒂创立新公司 估值将达90亿美元
在硅谷,前OpenAI首席技术官米拉・穆拉蒂(Mira Murati)的新公司 Thinking Machines Lab 正成为投资者关注的焦点。 据《商业内幕》的报道,这家成立不到一年的初创公司正在筹集10亿美元融资,估值预计将达到惊人的90亿美元,折合人民币约653.57亿元。 这一估值在初创企业中可谓凤求凰,尤其是在竞争激烈的人工智能(AI)行业中。
阿里最新深度思考模型强不强?我们让它和Grok3比拼了下
AI好好用报道编辑:杨文又来了一个深度思考模型。 昨天,阿里 Qwen 团队发了个博客,标题就是:乍一看,还以为电脑卡出了乱码,但再往下一瞅,里头大有「乾坤」,因为这篇博客:不是人写的。 而是出自阿里最新深度思考模型 QwQ-Max-Preview 之手。
19岁女棋手因AI作弊,被中国围棋协会重罚禁赛8年
中国围棋协会日前发布通报,对职业棋手秦思玥(2006年生)在全国围棋锦标赛(个人)女子组比赛中作弊行为做出严厉处罚。 通报显示,秦思玥在2024年12月15日的比赛中被发现携带手机,并利用人工智能程序作弊。 经调查,秦思玥不仅在赛前藏匿手机,还在比赛过程中实施作弊,且在被询问时隐瞒事实,情节严重。
DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练革命
今日,国内人工智能领军企业DeepSeek正式公开其开源计划的第四日成果——Optimized Parallelism Strategies(优化并行策略),重点推出双向管道并行算法DualPipe、专家并行负载均衡器EPLB,以及对计算-通信重叠机制的深度优化。 此次技术升级直击大规模语言模型训练的核心痛点,为超万卡级集群的高效运行提供了全新解决方案。 DualPipe:双向管道并行算法作为本次升级的核心技术之一,DualPipe专为V3/R1架构设计,通过创新的双向数据流管道,实现计算与通信的高度重叠。
人人都是有声书创作者:ElevenLabs 开放 AI 语音技术,让你的文字“声”动人心
ElevenLabs发布ElevenReader Publishing平台,利用AI技术帮助作者快速制作专业的有声书。该平台提供语音定制、节奏控制等个性化功能,并支持变现渠道。#AI科技资讯 #有声书
Hugging Face 推出 FastRTC:实时语音视频应用开发变得轻而易举
AI 初创公司 Hugging Face 宣布推出 FastRTC,这是一个开源的 Python 库,旨在消除开发人员在构建实时音频和视频 AI 应用时面临的重大障碍。 Hugging Face 的 FastRTC 旨在简化 WebRTC 和 Websocket 应用的构建过程。 Freddy Boulton,FastRTC 的创建者之一表示:“在 Python 中,构建实时 WebRTC 和 Websocket 应用非常困难,直到现在才有所改变。
AI工具在大学生中普及 老师表示AI作文全判0分
近期,央视新闻报道指出,AI工具已成为大学生完成报告、论文的“神器”。 然而,这一现象也引发了学术不端行为的担忧。 一些高校教师和专家表示,少数学生利用AI伪造研究数据、编辑实验图片等,严重影响了学术诚信。
全球AI顶会AAAI 2025 在美开幕,产学研联手的“中国队”表现亮眼
当地时间2月25日,AAAI 2025 在美国宾夕法尼亚州费城举办,会议为期8天,于3月4日结束。 AAAI 由国际人工智能促进协会主办,是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议,每年举办一届。 AAAI 2025 共有12957篇有效投稿,录用3032篇,录取率为 23.4%。
极氪智能科技首创汽车座舱端侧AI大模型离线部署
在智能汽车领域,极氪智能科技日前宣布了一个引人注目的成就:成功完成了汽车行业首个端侧 AI 大模型的离线部署。 这一技术的实现,不仅意味着极氪在汽车智能化进程中迈出了重要一步,更是为用户带来了全新的驾驶体验。 通过这一技术,极氪汽车将能够在不依赖网络的情况下,实时进行图文理解与推理,大大提升了车辆的智能化水平。
阿里开源视频生成模型Wan 2.1上线即屠榜 4070可流畅运行
近日,阿里巴巴在深夜推出了全新的开源视频生成模型 Wan2.1,该模型凭借14B 的参数量迅速占据了 VBench 榜单的顶端,成为目前视频生成领域的佼佼者。 与此之前发布的 QwQ-Max 不同,Wan2.1在复杂运动的细节处理上表现出色,能够流畅地实现多个人物的同步舞蹈,令人惊叹不已。 官方演示中,Wan2.1不仅成功克服了静态图像生成中的难题,如文字的处理更是达到了新的高度。
字节跳动悟空浏览器接入DeepSeek R1模型,或为抖音接入铺路
字节跳动旗下悟空浏览器近日正式接入DeepSeek R1模型,这一举措引发业界广泛关注。 与此前飞书、火山引擎接入DeepSeek不同,悟空浏览器作为面向C端用户的产品,融合了抖音与番茄小说等内容,其接入被认为可能为抖音未来接入DeepSeek铺路。 目前,悟空浏览器同时搭载豆包与DeepSeek两大模型,DeepSeek R1主要负责智能对话与文本生成,而豆包则提供AI快捷功能,应用场景更为广泛。
卓世科技:text2SQL技术浅谈
text2sql 技术是一种将自然语言(NL)转化为可被数据库执行的结构化查询语言 SQL 的技术。 自然语言可以是我们熟悉的一段文本,也可以是一段语音,又或者是其它可转化为文本的输入形式。 通过该技术,能够让不懂数据库操作的非技术人员提取、分析数据,无需学习编写 SQL 语句,无需了解不同 SQL 数据库的使用软件,通过输入文本描述的问题需求,即可得到对应需求下的数据结果。
特朗普发布 AI 生成视频,描绘了一个“加沙乐园”
日前,美国前总统唐纳德・特朗普在他拥有控股权的社交媒体平台 Truth Social 上,发布了一段引发广泛关注的 AI 生成视频。 该视频试图描绘一个由特朗普统治的加沙地带的未来景象,内容奇幻且引人瞩目。 视频开头呈现了一个战火纷飞的加沙场景,身着武装装备的阴影人物在废墟中游荡,孩童在危机中奔跑。
ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%
ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。 该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。 根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。
英伟达CEO黄仁勋: DeepSeek不会对公司销售造成影响,销量持续攀升
在近日的财报电话会议上,英伟达 CEO 黄仁勋对公司的未来展望依旧充满信心,尽管上个月因中国的 DeepSeek 技术引发了一场市场恐慌。 他表示,DeepSeek 的推出不会对公司的销售造成影响。 市场对 DeepSeek R1模型所需的芯片数量大幅减少的猜测,曾导致英伟达的股价出现了创纪录的下跌。
2025年AI大模型价格战加剧,相关概念股受到资金追捧
近年来,人工智能(AI)大模型技术发展迅猛,随之而来的降价潮使得市场竞争愈发激烈。 根据数据宝的最新统计,2025年这一降价趋势仍将持续。 尤其是在过去的一段时间里,字节跳动、阿里云等企业纷纷宣布降低旗下 AI 大模型的使用成本,引发了业界的广泛关注。
微软发布 Phi-4 多模态与迷你模型,语音视觉文本处理再升级
近日,微软进一步扩展了 Phi-4家族,推出了两款新模型:Phi-4多模态(Phi-4-multimodal)和 Phi-4迷你(Phi-4-mini),这两款模型的亮相,无疑将为各类 AI 应用提供更加强大的处理能力。 Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构模型,拥有5600万参数。 这款模型在多项基准测试中表现优异,超越了目前市场上的许多竞争对手,例如谷歌的 Gemini2.0系列。
大学老师说AI作文全判0分 网友:过度依赖造成思维惰性
近年来,随着人工智能技术的迅速发展,AI 工具逐渐成为大学生完成各类报告和论文的 “得力助手”。 根据央视新闻的报道,部分高校教师和专家表示,利用 AI 生成内容的学生中,个别案例涉及不当行为,如伪造研究数据、编辑实验图片和替代自主设计等,已构成学术不端。 在某高校的作业群中,一则通知引起了学生们的广泛关注。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉