OCR技术
NeurIPS2024 | OCR-Omni来了,字节&华师提出统一的多模态文字理解与生成大模型
这项研究不仅推动了 OCR 技术的进步,也为人工智能在理解和创造方面的发展提供了重要参考。
10/16/2024 11:47:00 AM
机器之心
AI将诗意装进口袋!合合信息扫描全能王“扫描书籍”功能优化上线
人间最美四月天,正是读书好时节。4月20日至23日,正值“世界读书日”之际,合合信息旗下扫描全能王联合上海首家图像小说主题书店——安古莱姆书店,共同发起“春天正是读书天”线下公益阅读活动,为公众带来一场春日文学盛宴。“世界读书日”期间,为方便阅读爱好者们随时随地畅享阅读的乐趣,扫描全能王于安卓端升级上线“扫描书籍”模式。通过AI扫描生成高清电子图书,帮助用户构建随身“知识库”,开启高效、便捷的“绿色”阅读新方式。“春天正是读书天”公益活动现场,参观者们正在排队领取书籍世界读书日,细品“沪元素”绿意盎然的春天主题图书
4/25/2024 10:46:00 AM
机器之心
- 1
资讯热榜
早鸟票倒计时3天|第四届全国大模型智能生成大会(LMG 2025)
美国女子使用ChatGPT生成号码购彩中奖10万美元:概率事件而非AI预测能力
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
OpenAI 紧急暂停 Sora生成马丁・路德・金形象,AI 视频生成引发热议!
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
LLM的“记忆”与“推理”该分家了吗?一种全新的训练范式,彻底厘清思考流程
AI智能体的未来要等十年?Karpathy直言目前的技术还很 “菜”!
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
AI for Science
Stable Diffusion
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
百度
RAG
Sora
具身智能
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
DeepMind
架构
视觉
预测
Transformer
编程
生成式AI
伟达
AI模型
特斯拉
Copilot