视觉思考模型

Kimi 数理化能跟 o1 掰手腕了？新模型 k1 有点儿强

最直接的实测例子是：当我们把杨振宁、伽利略等世界知名科学家的研究手稿拍照、上传后，k1 居然能识别图片中的文字，生动解读背后的物理、天文学等科学知识，从而回答用户的提问并给出清晰完整的推理思考过程。例如，当我们上传杨振宁的手稿并向 k1 提问，k1 给出了超乎小编知识范畴所能辨真伪的答案：这是杨振宁的手稿图片——这是我们的询问：这是物理学家杨振宁的手稿照片，请你一步一步分析，杨振宁在计算什么，他可能在想什么，当时可能是什么背景？这是 k1 的回答：上下滑动查看长图虽然小编既不懂电磁场、也不懂粒子动力学，但看完 k1 的答案着实大吃一惊！

12/16/2024 6:37:00 PM

张进

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词）

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 马斯克英伟达 Anthropic 图像 AI创作训练 LLM 论文代码算法 AI for Science 苹果 Agent 腾讯 Claude 芯片 Stable Diffusion 蛋白质具身智能开发者 xAI 生成式神经网络机器学习人形机器人 3D AI视频 RAG 大语言模型 Sora 研究百度生成 GPU 工具华为字节跳动计算 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind AI模型亚马逊特斯拉场景深度学习架构 Transformer MCP Copilot 编程视觉