应用
开源OCR工具olmOCR:高效实现 PDF 转文本,支持表格与手写识别
olmOCR 是一款开源的光学字符识别(OCR)工具,旨在高效地将 PDF 及其他文档转换为纯文本,同时保留自然的阅读顺序。 这款工具不仅支持普通文本的提取,还能处理表格、数学公式和手写内容,极大地方便了用户对文档的处理需求。 这款工具的核心优势在于其高准确率。
3/3/2025 9:25:00 AM
AI在线
科大讯飞星火 X1 模型升级,数学能力全面对标 DeepSeek R1 和 OpenAI o1
科大讯飞表示,此次升级在数学答题效果上全面提升,尤其是应对竞赛级难题表现显著。同时,星火 X1 在中小学数学作业的批改、辅导以及题目推荐等任务上也展现出了明显的优势。
3/3/2025 9:22:01 AM
汪淼
国内首个光子 AI 智能引擎在南京诞生
南京江北新区企业南京南智先进光电集成技术研究院有限公司(以下简称“南智光电”)联合南京知满科技等合作伙伴开发出国内首个光子 AI 智能引擎“OptoChat AI”,并已完成内部测试,计划 3 月正式上线,免费开放给业界使用。
3/3/2025 9:18:38 AM
归泷(实习)
智谱AI宣布完成新一笔金额超10亿元战略融资
近日,国内领先的人工智能企业智谱宣布完成了一笔金额超过10亿元人民币的战略融资。 此次融资由杭州城投产业基金、上城资本等多家投资机构共同参与,为智谱的进一步发展和技术创新注入了强劲动力。 据悉,这笔融资将主要用于推动国产基座GLM大模型的技术创新和生态发展。
3/3/2025 9:09:00 AM
AI在线
荣耀发布阿尔法计划 5年投入100亿美元建设AI生态
昨晚,MWC2025全球移动大会在上海正式拉开帷幕,荣耀新任CEO李健在会上首次亮相,并正式发布了荣耀的全新人工智能战略计划——“阿尔法计划”。 作为荣耀的新掌舵人,李健在发布会上宣布,未来五年,荣耀将投入高达100亿美元的资金,与全球合作伙伴共同构建AI设备生态,标志着荣耀从智能手机制造商向全球AI终端生态公司的全面转型。 值得注意的是,这也是李健自接任荣耀CEO以来的首次公开亮相。
3/3/2025 8:26:00 AM
AI在线
英语客服印度口音太重?全球最大呼叫中心运营商 Teleperformance SE 推出 AI 语音实时优化系统
全球最大的呼叫中心运营商 Teleperformance SE 推出了一款人工智能系统,可实时调整印度英语客服人员的口音,以提高沟通的清晰度。
3/3/2025 8:16:13 AM
清源
联想摩托罗拉发布全新“Smart Connect”功能:一句话让 AI 帮你找文件
此前的Smart Connect可以让摩托罗拉、联想设备之间无缝协作,而在MWC 2025期间,该功能迎来一项重大升级。
3/3/2025 7:14:44 AM
清源
Photoshop 正式发布移动端!为何我却不看好?
2月25日,Adobe 正式发布了 iPhone 版的 Photoshop,这个在桌面端制霸多年的专业视觉设计神器,终于在移动端用户数量超过桌面端用户的 12 年之后,登陆到这块小屏幕上了。 1、是 Phtoshop 不是 PS Express. 这个时候,就有同学要问了,Adobe 不是早就发布了移动端的 ps 么?
3/3/2025 1:17:39 AM
陈子木
东京测试人形机器人助力养老护理,应对日本老龄化难题
日本东京正在测试一款名为AIREC的人形机器人,旨在解决老龄化社会的护理人员短缺问题。这款AI驱动的护理机器人能够完成如更换尿布等关键护理任务,预计2030年投入使用。随着老龄化加剧,机器人护理的未来备受关注。#养老机器人##老龄化社会#
3/2/2025 7:13:37 PM
远洋
马斯克:AI 毁灭人类的风险为 20%,未来结果更可能“超级棒”
埃隆・马斯克在《乔・罗根体验》播客中分享了对AI发展的看法,认为AI导致人类毁灭的概率为20%,但更可能出现“超级棒”的结果。他还预测AI将在未来一两年内超越人类智力,并在2029年或2030年达到“比所有人类加起来更聪明”的水平。#AI未来##马斯克#
3/2/2025 6:54:47 PM
远洋
消息称软银 CEO 孙正义计划借款 240 亿美元大举投资 AI
据 The Information 报道,软银集团(SoftBank Group)首席执行官孙正义(Masayoshi Son)计划借款 160 亿美元(IT之家备注:当前约 1166.38 亿元人民币)用于投资人工智能领域。消息人士透露,该公司高管上周已向银行方面传达了这一计划。报道指出,这家日本科技投资巨头可能在 2026 年初进一步借款 80 亿美元(当前约 583.19 亿元人民币),以持续推进其在人工智能领域的战略布局。
3/2/2025 6:27:19 PM
远洋
清华大学 2025 年将适度扩招本科生,重点培养“AI+”拔尖创新人才
据新华社报道,从清华大学获悉,为服务国家战略需求和社会发展需要,该校计划在 2025 年有序扩大本科招生规模,新增约 150 个本科生招生名额。同时,清华大学将成立新的本科通识书院,旨在培养人工智能与多学科交叉的复合型人才。据悉,该校新增本科生将进入新成立的书院学习。
3/2/2025 3:31:13 PM
远洋
腾讯携手创新“无监督前缀微调”技术:训练 tokens 最多减少 95%,提升 AI 推理效率
腾讯AI Lab与香港中文大学合作,提出“无监督前缀微调”(UPFT)方法,通过聚焦模型输出的前8至32个词元,显著提升大型语言模型的推理效率。该方法在多个推理基准测试中表现优异,减少训练和推理词元的同时提升准确率。#腾讯AI #语言模型 #UPFT
3/2/2025 3:07:16 PM
故渊
GPT-4.5 性能提升有限、成本却激增 30 倍,OpenAI 面临性价比质疑
科技媒体The Decoder报道,OpenAI新模型GPT-4.5在性能仅小幅提升的情况下,其使用成本却大幅增加。输入tokens的成本是GPT-4o的30倍,输出则为15倍,引发了业界对其实用性的讨论。##GPT4.5 #OpenAI
3/2/2025 2:50:14 PM
故渊
ICLR 2025 | 机器人安灯泡、切东西都能拿捏,可操控轨迹跟踪的DexTrack来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
3/2/2025 2:25:00 PM
机器之心
千万网友围观,两个语音AI开始加密通话,网友:中间真没骂我两句?
AI智能体有自己的交流方式。 最近有这么一段视频被千万网友围观。 两个 AI 智能体语音对话这件事听起来平平无奇,这不就是基操吗?
3/2/2025 2:20:00 PM
机器之心
湖北武汉首例“AI 生成图被侵权”著作权纠纷案一审宣判,被告公司需赔偿 4000 元
武汉首例AI生成图侵权案一审宣判,法院认定AI作品具有独创性,应受著作权法保护。王某使用AI软件生成的图片被某科技公司侵权使用,法院判决赔偿4000元。目前国内对AI创作作品保护尚无明确法律,专家呼吁加快AI版权立法。#AI版权# #著作权法#
3/2/2025 12:04:22 PM
漾仔
AI影像编辑下放中端市场 三星Galaxy A系列新机支持6年系统更新
三星近日为其Galaxy A系列中端机型注入更多AI能力,推出Galaxy A56、A36和A26三款新机,主打“超棒智能”体验。 新机搭载多项AI影像功能,包括动态照片表情替换工具Best Face,类似谷歌Pixel的Best Take,可在拍摄对象眨眼或视线偏移时优化照片。 此外,改进的对象移除工具、照片滤镜以及谷歌的Circle to Search功能(圈选搜索)也悉数登场。
3/2/2025 11:04:00 AM
AI在线
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
特斯拉