数字化
大模型赋能文化遗产数字化:古籍修复与知识挖掘的技术实践
                        在文化遗产数字化领域,大模型的核心应用难点在于如何处理古籍中大量的异体字、残缺文本与模糊语义,尤其是面对明清时期的手写残卷,传统的文字识别技术不仅准确率低下,更无法理解古籍中蕴含的历史语境与专业术语。 我在参与某博物馆古籍数字化项目时,首先遭遇的便是大模型对古籍文字的“识别盲区”—初期使用通用大模型识别一本明代医学残卷,发现其将“癥瘕”误判为“症痕”,把“炮制”错解为“泡制”,更无法关联“君臣佐使”等中医方剂配伍逻辑,导致提取的知识完全偏离原意。 为解决这一困境,我没有直接进行模型微调,而是先搭建“古籍文字与语境知识库”:通过整理《说文解字》《康熙字典》等权威字书,以及近现代古籍整理学术成果,构建包含5000 异体字、通假字的对照词典,每个文字标注字形演变、常见语境与释义差异;同时,针对医学、天文、历法等专业领域古籍,收集对应的行业术语库,标注术语的历史用法与现代对应概念(如“勾陈”对应天文领域的“小熊座”)。
                    
                    10/13/2025 6:10:28 PM
                        
                    许辉
                    别再给大模型打鸡血,先救救被“智能体”三个字忽悠的预算
                        “兄弟,我们老板昨天看完路演,拍桌子要上Agent,说三个月让客服成本归零。 ”“归零? 他以为Agent是灭霸,打个响指预算就蒸发?
                    
                    10/11/2025 9:40:11 AM
                        大数据AI智能圈
                    又是浙大校友!AI眼镜“隔空取物”,戴上即可随心选中现实世界任意物体
                        只靠说话和AI眼镜互动,确实有点不方便。 现在新玩法来了! 数字替身帮你“隔空抓物”,混合现实即时选择现实世界的物体作为上下文。
                    
                    8/8/2025 9:04:00 AM
                        
                    数据才是AI的真正护城河啊!
                        一位做AI创业的朋友跟我抱怨:"模型架构都差不多,算力也能买到,为什么我们的模型就是比不过大厂? " 我问他:"你们用什么数据训练的? " 他说:"Common Crawl啊,大家不都用这个吗?
                    
                    7/30/2025 4:00:00 AM
                        大数据AI智能圈
                    数据的五宗罪,道出了数据治理的真正内涵
                        "老板,我们的数据量已经达到了PB级别! " "那我们的业务决策准确率提升了吗? " "这个......" 这就是当下企业面临的真实困境:数据的"富营养化"。
                    
                    7/28/2025 6:00:00 AM
                        大数据AI智能圈
                    信息化,数字化,智能化是三种不同的概念吗?
                        信息化转型什么是信息化转型企业信息化实质上是将企业的生产过程、物料移动、事务处理、现金流动、客户交互等业务过程数字化,通过各种信息系统网络加工生成新的信息资源,提供给各层次的人们洞悉、观察各类动态业务中的一切信息,以作出有利于生产要素组合优化的决策,使企业资源合理配置,以使企业能适应瞬息万变的市场经济竞争环境,求得最大的经济效益。 信息化转型目的企业间的竞争应当包括产品竞争、价格竞争、品种竞争、服务竞争、市场竞争和信誉竞争等诸多方面。 随着我们一边完成工业化进程,一边步入信息时代,这种种竞争的方面也都不可避免地被打上了信息化的烙印。
                    
                    6/11/2025 8:38:08 AM
                        一个数据人的自留地
                    飞书将上线AI产品“知识问答” 革新企业知识管理
                        近日,飞书宣布即将推出全新AI产品“知识问答”,以智能化手段重塑企业知识管理模式,助力企业数字化转型。 “知识问答”是一款深度融合人工智能技术的问答工具,能整合企业员工在飞书上有权限访问的各类信息,包括文档、消息记录等,员工在工作中遇到业务、技术等各类问题,都能快速获取精准答案,极大提升工作效率。 在实际测试场景中,其表现亮眼。
                    
                    5/21/2025 2:01:08 PM
                        AI在线
                    你的数据有多好,你的模型就有多强
                        在AI大战烽火连天的今天,所有人都在追逐参数规模的增长和架构的优化。 然而,行业内的一个秘密正在悄然成形:拥有独特数据资产的企业正在构筑起难以逾越的竞争壁垒。 数据,而非算法,正成为区分强弱的决定性要素。
                    
                    4/24/2025 12:40:00 AM
                        大数据AI智能圈
                    清华张亚勤:10年后,机器人将可能比人都多
                        “10年后,机器人将可能比人都多,会陆续进入工厂、社会,最终形态是进入家庭。 未来每个人、每个家庭都有机器人。 ”这样的预言,来自清华大学智能产业研究院(AIR)院长张亚勤。
                    
                    4/21/2025 9:30:00 AM
                        量子位
                    知识图谱与其它知识库的关系
                        知识图谱与传统知识库:解构数据连接的哲学传统企业数据库和知识库长期以来一直被当作信息的仓库,它们好比一个个分隔的抽屉,每个抽屉里都整齐地存放着特定类型的信息。 企业习惯了这种存储方式,却很少思考:我们真的需要将信息放在不同的抽屉里吗? 知识图谱打破了这种传统思维,它将信息视为一张巨大的网络——每条信息都是网络中的一个节点,节点之间通过各种关系连接起来。
                    
                    4/18/2025 12:49:58 PM
                        大数据AI智能圈
                    DeepSeek再好,还得先进行数据清洗!
                        数据分析师的日常,有大半时间都在和数据"搏斗"。 每当接到一份数据,第一反应往往是叹气: "这数据质量...又得清洗半天。 " 数据清洗就像是数据分析的"地基工程",地基不牢,上层再漂亮也会坍塌。
                    
                    4/7/2025 12:30:00 AM
                        
                    DeepSeek如何助力数字化转型?一文讲清六大应用场景!
                        在当今竞争激烈的制造业市场中,数字化转型已成为企业生存与发展的关键。 而最近爆火的 DeepSeek,为制造业企业的数字化转型带来了新的契机。 今天制造企业CIO就来和大家聊聊如何利用 DeepSeek帮助企业实现数字化转型。
                    
                    3/19/2025 9:48:09 AM
                        数据人作者联盟
                    首篇「角色扮演AI」综述!复旦等提出大模型三层人格分类框架:群体、角色、个性化 | TMLR
                        角色扮演AI系统体现了数字生命的理念,通过交互形式将不同角色带入现实。 这些系统模拟指定角色的能力,长期以来一直存在于人类想象中,体现了我们创造和与具有智能的人工生命互动的渴望。 近期,得益于GPT-4、LLaMA等大语言模型(LLMs)的突破性进展,基于文本的角色扮演AI(Role-Playing Language Agents,RPLAs)正在从科幻走进现实。
                    
                    12/27/2024 1:30:00 PM
                        新智元
                    架构赋能 AI:知识工程推动下的软件架构数字化
                        TL;DR:我们试验了将 AI 应用到基于 Protobuf 的微服务架构中,基于 ArchGuard 治理平台、Shire AI 助手、Team AI 三个工具中,构建了一套完整的 AI4SE 原型,在需求、设计、开发、测试和运维等阶段,这里是我们的思考和实践。 过去几个月里,我们在各大技术大会上频繁看到生成式 AI 的应用,很多研发组织都在尝试将其引入开发的各个环节。 然而,随着 AI 技术的深入应用,不少组织也发现了基础知识工程方面的种种挑战。
                    
                    11/4/2024 9:05:04 AM
                        Phodal
                    “数智说”工业智能化论坛成功举办
                        为了进一步汇聚起推进新型工业化的强大合力,推动数字蝶变行动落地见效,12 月 16 日,数智上海 2023 峰会“数智说”工业智能化论坛在上海市杨浦区举办,邀请高校知名专家学者、高端制造业企业和科技企业代表,共享工业数智化丰富经验成果与未来趋势洞见。活动由上海市城市数字化转型工作领导小组办公室、上海市经济和信息化委员会、上海市杨浦区人民政府指导,上海市杨浦区科学技术委员会、上海市城市数字化转型应用促进中心主办,中国联合网络通信有限公司上海市分公司联合主办,机器之心(上海)科技有限公司承办。上海市经济和信息化委员会软
                    
                    12/21/2023 5:49:00 PM
                        新闻助手
                    数智上海 2023 峰会“数智说”工业智能化论坛成功举办
                        为了进一步汇聚起推进新型工业化的强大合力,推动数字蝶变行动落地见效,12 月 16 日,数智上海 2023 峰会“数智说”工业智能化论坛在上海市杨浦区举办,邀请高校知名专家学者、高端制造业企业和科技企业代表,共享工业数智化丰富经验成果与未来趋势洞见。活动由上海市城市数字化转型工作领导小组办公室、上海市经济和信息化委员会、上海市杨浦区人民政府指导,上海市杨浦区科学技术委员会、上海市城市数字化转型应用促进中心主办,中国联合网络通信有限公司上海市分公司联合主办,机器之心(上海)科技有限公司承办。上海市经济和信息化委员会软
                    
                    12/18/2023 4:53:00 PM
                        新闻助手
                    数智上海2023峰会将于12月举办,邀各界共享数字化转型最新成果与经验
                        数字技术创新和数字经济发展已经成为推进新型工业化的加速器,为经济高质量发展注入强劲动能、形成强力支撑。为了进一步推广上海数字化转型最新成果与可行性经验,助力数字技术交流与科技创新合作,「2023 上海数字化转型体验周」期间将举办首届「数智上海 2023 峰会」。以「数字化转型推进新型工业化」为主题,「数智上海 2023 峰会」将于 12 月中旬在上海杨浦举办。峰会将设置多场聚焦前沿数字技术创新与应用赋能的活动,并进行多项重磅发布,邀请众多政府领导、院士专家、数字化转型场景方与技术方企业代表,带来一场顶级智慧与前瞻思
                    
                    11/18/2023 9:47:00 AM
                        机器之心
                    
        资讯热榜
    
    
                LangChain V1.0 深度解析:手把手带你跑通全新智能体架构
        全网刷屏的「电影感」三宫格图片,教你用AI快速生成!
        消息称软银批准对 OpenAI 追加 225 亿美元投资,助力未来上市
        OpenAI 宣布印度用户可享受一年免费 ChatGPT Go 服务
        软银豪掷225亿美元加码OpenAI,AI音乐与超级融资计划全面提速
        OpenAI进军音乐创作领域,携手茱莉亚学院学生打造全新AI音乐模型
        Transformer 之父“叛逃”:我已经受够了 Transformer!警告:AI研究变得越来越窄,我们需要找到新的架构
        LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
    
        标签云
    
    
                    
                    AI
                    
                    
                    人工智能
                    
                    
                    OpenAI
                    
                    
                    AIGC
                    
                    
                    模型
                    
                    
                    ChatGPT
                    
                    
                    DeepSeek
                    
                    
                    谷歌
                    
                    
                    AI绘画
                    
                    
                    机器人
                    
                    
                    大模型
                    
                    
                    数据
                    
                    
                    Midjourney
                    
                    
                    开源
                    
                    
                    Meta
                    
                    
                    智能
                    
                    
                    微软
                    
                    
                    用户
                    
                    
                    AI新词
                    
                    
                    GPT
                    
                    
                    学习
                    
                    
                    技术
                    
                    
                    智能体
                    
                    
                    马斯克
                    
                    
                    Gemini
                    
                    
                    图像
                    
                    
                    Anthropic
                    
                    
                    英伟达
                    
                    
                    AI创作
                    
                    
                    训练
                    
                    
                    LLM
                    
                    
                    论文
                    
                    
                    代码
                    
                    
                    算法
                    
                    
                    Agent
                    
                    
                    AI for Science
                    
                    
                    芯片
                    
                    
                    苹果
                    
                    
                    腾讯
                    
                    
                    Stable Diffusion
                    
                    
                    Claude
                    
                    
                    蛋白质
                    
                    
                    开发者
                    
                    
                    生成式
                    
                    
                    神经网络
                    
                    
                    xAI
                    
                    
                    机器学习
                    
                    
                    3D
                    
                    
                    RAG
                    
                    
                    人形机器人
                    
                    
                    研究
                    
                    
                    AI视频
                    
                    
                    生成
                    
                    
                    大语言模型
                    
                    
                    具身智能
                    
                    
                    Sora
                    
                    
                    工具
                    
                    
                    GPU
                    
                    
                    百度
                    
                    
                    华为
                    
                    
                    计算
                    
                    
                    字节跳动
                    
                    
                    AI设计
                    
                    
                    AGI
                    
                    
                    大型语言模型
                    
                    
                    搜索
                    
                    
                    视频生成
                    
                    
                    场景
                    
                    
                    深度学习
                    
                    
                    DeepMind
                    
                    
                    架构
                    
                    
                    生成式AI
                    
                    
                    编程
                    
                    
                    视觉
                    
                    
                    Transformer
                    
                    
                    预测
                    
                    
                    AI模型
                    
                    
                    伟达
                    
                    
                    亚马逊
                    
                    
                    MCP
                    
        
     
                     
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                 
                