一、医疗保健与生命科学
在制药和生物技术领域,知识图谱正在加速药物发现和再利用。这些知识图谱将异构生物医学数据整合到单一知识网络中,比如基因、蛋白质、疾病、药物、临床试验、文献等。研究人员可以查询或分析该图谱,以发现不明显的联系,例如,与两种看似不相关的疾病有关的基因可能暗示着共同的靶向途径。
一个具体的案例是:阿斯利康建立了一个全面的生物医学知识图谱,将基因与疾病和化合物联系起来,他们的科学家利用该图谱预测新的药物靶点并重新定位现有药物。另一个例子是一家初创公司,它使用知识图谱通过将症状、遗传标记和已知的药物机制联系起来,寻找罕见疾病的候选药物。其工作原理:知识图谱通过将化合物与蛋白质靶点和已知效应联系起来,从而实现靶点识别,因此 AI 算法可以确定优先研究的靶点。它们还支持药物重新利用:通过映射药物和疾病之间的关系,知识图谱可以突出显示与不同疾病的生物途径相互作用的现有药物,从而表明存在重新利用的机会 。
2023 年,生物医学知识图谱甚至已与人工智能相结合,以预测新的联系:例如,人工智能可能会遍历知识图谱并假设药物 X可能治疗疾病 Y,因为路径类似于 X -> 靶向酶 A -> 与疾病 Y 有关。《自然》杂志的一篇文章描述了一些案例研究,其中知识图谱通过揭示这些隐藏的联系来帮助发现治疗乳腺癌和阿尔茨海默氏症药物的新用途。这样做的好处是,研究人员不必从零开始或淹没在数据中——知识图谱会组织所有已知知识,以便人工智能或人类可以对其进行有效地查询和推理。这可以更快地生成假设,并可以更明智地决定进行哪些实验或试验。有公司报告称,使用知识图谱帮助他们筛选出最有前景的候选药物,速度比人工审查数千篇论文要快得多。另一个运营优势是协作:这些知识图谱通常作为单一事实来源,不同的专家(生物学家、化学家、数据科学家)可以贡献和查询,从而打破化学和临床研究等部门之间的数据孤岛。
此外,在医疗保健领域,医院系统使用知识图谱进行患者数据整合并提供护理建议。例如,知识图谱可以将患者症状、实验室结果、诊断和治疗与医学知识(指南、药物相互作用)联系起来。这可以为临床决策支持系统提供支持,该系统可以为患者提供可能的诊断建议或标记危险的药物相互作用。例如,梅奥诊所尝试使用知识图谱将患者记录与医学本体相结合,以提高诊断准确性和个性化护理。例如:知识图谱在 COVID-19 疫情中得到应用——将病毒基因、出版物和药物数据库联系起来,以快速识别可能对该病毒有效的现有药物(这发生在疫情初期,当时知识图谱方法识别出了可重新利用的候选药物)。关键在于:在医疗保健领域,知识图谱 (KG) 提供了可解释的 AI——例如,通过追踪知识图谱中的路径(患者具有生物标志物 A -> 与疾病 B 相关 -> 可用药物 C 治疗)来解释为什么建议患者使用某种药物。这种透明度对于医疗决策至关重要,并能建立人们对 AI 建议的信任。
二、财务金融方面
金融机构处理着庞大的交易、账户、公司和个人网络。知识图谱可以自然地模拟这些网络,使其非常适合检测复杂的欺诈计划、洗钱和风险评估。与传统的基于规则的系统不同,传统的基于规则的系统只能捕捉简单的欺诈行为(同一张卡同时在两个地方使用),而知识图谱可以揭示微妙的、间接的模式——例如,一组表面上看似无关但实际上存在中间联系(例如,共享地址或资金通过中间账户转移)的账户,这些联系表明存在欺诈团伙。案例研究:金融软件公司Intuit使用图数据库 (TigerGraph) 打击其支付网络中的欺诈行为,发现了常规手段无法检测到的欺诈用户团伙。据报道,通过分析图中的关系(例如,常见的设备 ID、IP 地址或收款人重叠),Intuit 识别出的欺诈行为增加了 20%,误报率也降低了。同样,PayPal和Mastercard也讨论了基于图的方法来识别欺诈团伙和合谋商家。
欺诈图谱通常整合来自各种来源的数据:交易、客户信息、商户信息等,形成一个多实体、多关系的网络。在这些知识图谱上运行的社群检测或链接分析等图算法可以标记异常情况——例如,一组形成循环的交易是不寻常的(表明存在洗钱的分层),或者一群共享联系方式的人可能是一个欺诈共谋团伙。其结果是,可以更早地发现复杂的欺诈行为并减少损失。ACM 通讯的一篇文章(2024)强调,图数据库使金融机构能够捕捉传统关系数据库遗漏的隐藏模式,从而更快、更高效地检测欺诈。其好处还在于减少了误报——通过知识图谱考虑上下文,系统可以更加精确。例如,基于知识图谱的系统不会将单笔大额交易标记为欺诈,而是可能会发现发送方和接收方之间存在长期的业务关系(通过合约、共享董事会成员等在图中建立联系),从而避免误报。另一方面,它可能会捕捉到一些看似正常,但在考虑具体情况后实际上却很可疑的情况(例如,账户网络之间进行的许多小额交易加起来金额很大——单独来看不会触发规则,但图表会揭示出一个累积的方案)。银行也使用知识图谱来了解你的客户(KYC)。以及风险评估,将公司所有权、制裁名单、新闻和交易关联起来,以获得客户的整体风险评分。例如,如果新客户的知识图谱显示与空壳公司或受制裁个人的联系,银行就可以进一步调查。这为运营带来了便利——分析师无需手动拼凑来自各个数据库的信息,知识图谱 (KG) 会将这些信息整合在一起,通常还会使用可视化图表探索工具来追踪资金和所有权的流向。
三、电子商务和零售
像亚马逊、eBay、沃尔玛这样的在线零售商经营着数百万种产品,即使查询与产品文本不完全匹配,也需要帮助顾客找到他们想要的东西。知识图谱可以通过捕捉产品、类别和属性之间的关系,极大地改善电子商务网站上的语义搜索。例如,知识图谱可能知道“电视”是一种“电子产品”,并具有屏幕尺寸、分辨率、品牌等属性。如果用户搜索“三星 4K 50 英寸智能电视”,那么具有知识图谱的语义搜索系统可以从结构化方面理解此查询:品牌=三星,分辨率=4K,尺寸≈50 英寸,类别=电视(属于电子产品)。这样,即使产品的标签略有不同,它也可以检索到相关的产品(产品标题可能为“三星 50 英寸 4K LED 智能电视 - 型号 X”,如果单词不同,纯关键词搜索可能无法正确排名)。知识图谱 (KG) 提供了一个语义主干来映射同义词和关系——例如,它知道“TV”和“television”是一样的,“4K”表示最低分辨率,或者“blouse”是“shirt”的一种,所以查询“red blouse”应该匹配归类为衬衫的产品。构建产品、类别和属性的知识图谱对于实现直观的搜索体验至关重要,在这种体验中,引擎可以理解意图和上下文。亚马逊的产品知识图谱 (KG) 将从品牌关系到互补商品的所有内容联系起来;沃尔玛的 Polaris 搜索引擎通过产品分类的语义知识得到了改进。除了搜索之外,推荐系统还可以从知识图谱中受益,因为它可以超越“购买 X 的人也购买了 Y”的范畴。有了知识图谱,人们可以利用产品属性甚至外部知识进行基于内容的推荐。例如,知识图谱可以将一本书与其作者联系起来,并与该作者的其他书籍或同一类型的书籍联系起来,从而实现直观的推荐(“既然你喜欢阿加莎·克里斯蒂的这本推理小说,这里还有其他推理小说及其作者”)。像 eBay 这样的公司已经使用知识图谱将产品数据与语义信息(例如,捕捉风格、模式和趋势的时尚知识图谱)链接起来,以增强推荐和浏览功能。知识图谱还可以存储客户评论分析——例如,将产品 ID 与经常被称赞或抱怨的方面联系起来,然后根据用户关心的方面推荐产品。
总而言之,对于电子商务而言,知识图谱提高了可发现性和转化率:它们通过理解查询意图更快地引导客户找到合适的产品(从而降低挫败感和跳出率),并通过更智能的推荐来增加追加销售/交叉销售(例如,推荐兼容的配件,因为知识图谱知道哪些配件与某种电子产品型号搭配)。另一个好处是可解释性:电子商务 KG 可以实现诸如“为什么向我推荐这个?”之类的功能,答案是“推荐这款相机,因为它是您查看过的相机的较新型号,并且分辨率更高”,直接从图中的关系中绘制。
四、制造业和工业领域
制造商使用知识图谱 (KG) 来建模设备、流程、材料和供应商之间的复杂关系。例如,语义数字孪生——博世和西门子已经讨论过使用知识图谱来创建富含语义数据(元数据、维护记录、传感器类型)的工厂资产的数字化表示。这些知识图谱可以将物联网数据与领域知识相集成:例如,将传感器读数与机器及其所在的部件、该部件的维护历史记录以及该部件的供应商关联起来。其优势在于故障排除和预测性维护——如果供应商 X 的某一批次组件出现故障,知识图谱可以通过将故障事件与组件类型和供应商联系起来,快速揭示该模式。另一个用例是供应链知识图谱:像捷豹路虎这样的公司(根据 TigerGraph 案例研究)构建了一个知识图谱,通过映射数千个供应商、组件和车辆之间的关系来优化供应链。查询此图谱有助于回答“假设”问题,例如“如果 Y 地区的供应商 A 出现故障,哪些车型面临风险,哪些替代供应商可以满足需求?”。它提高了弹性和规划能力。
五、能源与公用事业
能源公司使用知识图谱 (KG) 来整合资产数据、网络拓扑和实时传感器数据。电网知识图谱可以展现变电站、变压器和线路的连接方式,以及它们的规格和当前负载。这有助于断电管理:当故障传感器跳闸时,知识图谱查询可以查找该组件下游的客户以及可用的重新路由选项。在一个案例中,一家公用事业公司构建了一个知识图谱,以统一来自地理信息系统 (GIS)、资产管理和气象系统的数据,从而能够更快地分析断电原因和受影响的基础设施。其优势在于响应速度更快,并能更好地进行预测性维护调度(通过类似组件在特定条件下发生故障的模式来捕获高风险组件)。
六、媒体和娱乐行业
流媒体服务和媒体公司经常使用知识图谱来丰富内容元数据并驱动推荐。例如,Netflix 就以使用复杂的标记系统(可以看作是知识图谱的一种形式,将电影与情绪、类型等属性关联起来)而闻名,它实现了超越简单协同过滤的个性化推荐。同样,Spotify 也收购了一些公司,构建了一个音乐知识图谱,将艺术家、专辑、类型,甚至情绪或播客联系起来,以增强音乐发现能力。这些知识图谱捕捉了内容中丰富的关系:电影中的演员、导演的风格、电影之间的主题联系等等。因此,如果用户喜欢某部电影,知识图谱可以帮助找到另一部具有共同关键元素(相同导演或相似情节主题)的电影,即使第二部电影历史上从未被同一观众共同观看过(通过内容相似性解决冷启动问题)。
七、公共部门和知识管理
政府机构使用知识图谱来链接跨部门数据(知识图谱支撑着许多开放的政府数据门户,将预算数据与结果关联起来等等),并用于情报收集(例如,反恐机构将来自不同情报来源的人员、地点和事件关联起来以识别威胁)。在这些高风险场景中,知识图谱的可解释性至关重要——分析师可以看到通往已识别威胁网络的连接链,这使得它比黑盒机器学习输出更可信。
八、教育与研究
像 Microsoft Academic Graph(现已停止服务,但它曾是一个涵盖出版物、作者和机构的知识图谱)或 OpenAlex 这样的学术知识图谱有助于发现研究联系。大学也使用知识图谱整合学生数据、课程设置、研究项目等,以获得内部洞察。
在所有这些领域,知识图谱的核心优势在于提供基于上下文且具有关联性的数据理解。其结果往往是改进决策:药物研究人员能够选择更精准的目标,欺诈调查人员能够发现更多欺诈行为,消费者能够找到他们真正想要的产品(从而提高销量),机器能够在故障前得到修复(从而节省成本),等等。更重要的是,许多用例都表明,知识图谱通常与其他人工智能/分析技术协同工作——它们提供结构化的支撑,使机器学习更加智能(例如机器学习模型的特征),并使结果易于人类解释。正是这种互补性,使得知识图谱日益成为构建智能自适应系统的行业工具包的重要组成部分。