AI在线 AI在线

Grab 自研语言模型解决亚洲语言识别难题

新加坡超级应用程序公司 Grab 近日在其工程博客上分享了其自研语言模型的开发经历,指出现有的大型语言模型在理解东南亚语言时表现不佳。 Grab 的超级应用程序提供打车、外卖、购物和金融服务等功能,覆盖新加坡、马来西亚、印尼、菲律宾、越南、泰国、柬埔寨和缅甸等国家,这些地区的文档通常使用非拉丁字母的脚本。 图源备注:图片由AI生成在执行如客户身份验证等合规工作时,Grab 需要准确提取身份证、驾照和注册证书等信息。

新加坡超级应用程序公司 Grab 近日在其工程博客上分享了其自研语言模型的开发经历,指出现有的大型语言模型在理解东南亚语言时表现不佳。Grab 的超级应用程序提供打车、外卖、购物和金融服务等功能,覆盖新加坡、马来西亚、印尼、菲律宾、越南、泰国、柬埔寨和缅甸等国家,这些地区的文档通常使用非拉丁字母的脚本。

AI机器人玩游戏

图源备注:图片由AI生成

在执行如客户身份验证等合规工作时,Grab 需要准确提取身份证、驾照和注册证书等信息。尽管尝试过光学字符识别(OCR)系统,但 Grab 发现这些技术在处理多样化的文档模板时效果不理想。

在2025年,Grab 开始探索是否可以利用大型语言模型来解决这一问题。尽管一些强大的商业模型具备能力,但在理解东南亚语言时常出现错误和延迟,而开源的视觉大型语言模型虽然更高效,但准确性仍不足。因此,Grab 决定自行构建一个视觉大型语言模型,该模型能将图像向量化,方便提取文本。

Grab 选择了阿里巴巴云的 Qwen2-VL2B 模型作为基础,因为它的体积适中,支持东南亚语言,并能动态处理不同分辨率的图像。随后,Grab 从 Common Crawl 中提取了东南亚语言的内容,并建立了内部合成数据管道,以生成各种字体和背景下的文本图像。团队采用低秩适配技术对 Qwen2-VL 进行微调,取得了在印尼文档处理上的良好效果。

尽管在泰语和越南语的识别上仍然存在挑战,Grab 最终决定进行完整参数微调。通过训练模型,使其学习东南亚语言的独特视觉模式,Grab 成功开发了一个轻量级的视觉大型语言模型,其表现超越了多种 OCR 工具和通用模型。Grab 表示,战略性地使用高质量数据,能够使小型专业模型实现高效与有效的结合。

未来,Grab 计划继续开发更多自有模型,以扩展其文档处理技术。

划重点:

📊 Grab 发现现有大型语言模型在东南亚语言识别上效果不佳,决定自研模型解决问题。  

🔍 自研的视觉大型语言模型在处理身份证和驾照等文档时取得了显著进展。  

🚀 Grab 将继续开发更多模型,以满足日益复杂的文档处理需求。  

相关资讯

文远知行获Grab投资数千万美元,双方将合作在东南亚大规模部署Robotaxi

文远知行获Grab投资数千万美元,双方将合作在东南亚大规模部署Robotaxi

8月15日,全球领先的自动驾驶科技公司文远知行WeRide(NASDAQ:WRD)宣布,东南亚地区的超级应用平台Grab(NASDAQ:GRAB)将对其进行数千万美元的股权投资。 此项投资是双方战略合作的一部分,旨在加速在东南亚大规模部署L4级Robotaxi及其他自动驾驶车辆,展现了双方的共同愿景:将文远知行的自动驾驶车辆接入Grab的运营网络当中,提升服务质量与安全水平。 该笔投资预计不晚于2026年上半年完成交割,具体交割时间将根据文远知行选定的时间点和成交条件确定。
8/15/2025 7:10:55 PM 量子位的朋友们
与 Waymo 正面对决?Grab 巨额投资德国远程驾驶初创 Vay,发力美国市场与东南亚协同

与 Waymo 正面对决?Grab 巨额投资德国远程驾驶初创 Vay,发力美国市场与东南亚协同

总部位于柏林的德国初创公司 Vay 周一宣布,已获得新加坡科技巨头 Grab 的 6000万美元投资。 Vay 是一家利用人工操作员远程驾驶租赁汽车往返客户处的公司。 Vay 首席执行官 Thomas von der Ohe 在 LinkedIn 上透露,该交易尚待监管部门批准,预计在年底前完成。
11/11/2025 11:17:21 AM AI在线
​进军配送自动化!Grab 收购 AI 机器人公司 Infermove,强化“最后一公里”物流

​进军配送自动化!Grab 收购 AI 机器人公司 Infermove,强化“最后一公里”物流

东南亚超级应用巨头Grab近日宣布了一项重磅收购,正式将中国人工智能机器人初创公司 Infermove(推行科技) 收入麾下。 此举标志着 Grab 在物流自动化领域迈出了关键一步,旨在通过前沿技术解决东南亚日益增长的配送需求。 本次收购的核心目标是强化 Grab 在“第一公里”与“最后一公里”配送网络中的竞争力。
1/7/2026 9:59:37 AM AI在线