Avner Algom先生拥有30多年领导高科技公司和引领尖端技术开发的经验。教育经历涵盖:以色列海法Reali预科学校(1970-1978)、美国加州计算机编程学院(1983)、Tapas MBA项目(2013)。他的专业知识涵盖技术领导和战略业务发展。他是以色列人类语言技术协会(IAHLT)的创始人兼理事,该协会是一项致力于推动以色列人类语言技术发展的国家级倡议,重点是增强希伯来语和阿拉伯语的理解能力。
IAHLT是生成式人工智能领域的杰出组织,汇集了来自业界和学术界的顶尖专家,推动语言模型开发和优化领域的创新。通过创建和传播高质量的语料库、语言资源、开源工具和语言模型训练,IAHLT 加速了人工智能驱动的语言技术的进步并促进了创新。
以下是访谈实录。

问:作为以色列人工智能专家,你能否介绍一下以色列在人工智能领域的全球地位?
Avner Algom:以色列拥有全球人工智能领导者的地位,是技术、制度和文化因素独特交汇的结果。展望未来,保持这一领导地位将有赖于在教育、包容性创新、合乎道德的AI治理以及与国际标准的整合方面持续投入。
以色列在人工智能领域的全球优势主要取决于如下因素:
1.精英人力资本与军事学术管道
以色列国防军特别单位致力于培养顶尖的人工智能和网络安全人才,让他们在实际操作中积累大型数据系统、信号情报和实用机器学习方面的经验。退伍军人通常从军事研发直接过渡到工业和学术界具有影响力的职位。
2.稳健的创新生态系统
以色列拥有密集的初创企业、风投基金、跨国研发中心(如谷歌、英伟达、英特尔、微软)和科技孵化器网络。政府项目(如以色列创新局)为早期人工智能创业项目和公私合作提供资金支持。
3.卓越的学术
诸如以色列理工学院、希伯来大学、魏茨曼研究所、特拉维夫大学以及巴伊兰大学等机构正在开展前沿的人工智能研究,且往往与业界及全球学术界展开合作。以色列研究人员经常在顶尖的人工智能会议(如NeurIPS、ICML、ACL)上发表论文。
4.跨部门整合
人工智能在农业技术、医疗技术、金融科技、移动技术以及国家安全等领域得到了广泛采用,并得到了公共部门和国防部门的强力支持。
健康组织(如Clalit、Maccabi)提供了结构化纵向医疗数据,从而推动了医疗保健领域的AI创新。
5.全球伙伴关系与出口导向
以色列的AI初创公司从一开始就着眼于全球市场。与美、欧和亚洲的战略伙伴关系,以及加入全球人工智能论坛(如GPAI),进一步将以色列融入全球人工智能治理和协作框架中。
6.弹性和敏捷性
以色列的创业文化鼓励快速实验、勇于冒险和适应变化,这非常契合日新月异的AI领域。
问:你能否描述一下你开发希伯来语和阿拉伯语兼容语言模型的项目?这项技术的全球商业价值是什么?
Avner Algom:希伯来语和阿拉伯语属于闪米特语系,由于语言和计算因素,自然语言处理 (NLP) 面临着独特的挑战。
与英语相比,两者的质量差距巨大,原因如下:
1. 商业潜力:大多数公司投资英语(英语使用者:全球约 4.7 亿人为母语 + 世界上大多数人为第二语言)。
2. 希伯来语母语使用者:只有 1000 万人——本地市场规模较小。
3. 闪米特语系语言比英语复杂。
4. 3 亿使用者带来的阿拉伯语多样性挑战:阿拉伯语拥有共同的文学语言和方言(以色列有 200 万使用者)。
然而,这一差距也为研究创新、公共部门投资和区域人工智能合作提供了机遇,尤其是在医疗保健、教育和公民技术等需要本地语言支持的领域。
我们目前正在提升语言模型 (“LLM-大型语言模型”/“SLM-小型语言模型”) 中希伯来语理解的质量。专注于开源模型以及本地和离线运行模型的能力,包括用于在笔记本电脑和手机上进行科学教学的教育用途。
阿拉伯语市场规模预估及增长动力
当前预估(2024/2025):
• 阿拉伯语自然语言处理市场规模(软件和服务):
每年约2.5亿至3亿美元(预估,碎片化),同比增长30%至40%。
• 预计市场规模(2030年):
10亿美元至15亿美元,驱动因素包括:
•智慧政府(例如阿联酋、沙特“2030愿景”)
•人工智能驱动的金融科技、医疗保健和教育
•内容审核和媒体自动化

Statista公司为以色列的文本和语音的自然语言处理细分提供了可靠的国家级预测——考虑到语言人口统计数据,该预测与希伯来语的使用情况非常接近。
问:希伯来语是世界上最古老的语言之一,和中文一样,有着几千年的历史,目前讲希伯来语的人口大概有2000万左右,对于一个使用人口不是特别多的小语种来讲,在希伯来语的基础上,建立这个大语言模型,对你们有哪些特殊的意义?在研究中,你们是怎么克服在研发和应用过程中的挑战?
Avner Algom:以色列保持技术领域的第一梯队,是全球科技顶尖的国家之一,并能够提供基于语言理解的服务,这是国家利益所在。所以,政府希望为公民提供服务,企业希望服务客户,学术研究希望保持顶尖水平,我们也必须在大语言模型环境中,支持我们的本土语言。为了实现这个目标,即为公民、客户和产业提供最好的服务,我们必须找到解决方案去克服所有的挑战。如何让希伯来语在语言模型中得到良好的支持并获得高质量的结果,这会面临很多挑战。
第一,需要克服资源的不足。众所周知,英语是世界上使用最广泛的语言,有大量文本、大量资源,所以收集海量文本并训练模型相对容易。但对于希伯来语来说,我们没有这么多文本,所以第一个挑战就是如何收集大量的希伯来语文本用于模型训练。
第二,涉及知识产权问题。即谁能使用什么文本,因为你不能随便拿别人的内容用于训练,你需要获得他们的许可,才能训练模型。
第三,是找到合适的公司和预算来完成这个项目。我们很幸运,在我的努力下成功整合了约20家公司后,我们获得了以色列政府和以色列创新局的大力支持,在我们筹集的34%预算的基础上,政府又提供了66%的资金,所以他们自己补贴了这个项目。我们还邀请了学术界的顶尖教授加入联盟,因此,产业界、学术界和政府的联合力量使我们能够执行这个重要的项目,并且在更短的时间内完成。得益于我们在人力、预算和内容方面有更多资源。正是这些资源,如今我们看到了成果,我们看到了越来越多的客户关系、管理服务、聊天机器人、呼叫中心能够自动化服务流程。看到教育系统、医疗系统中的高效服务,所以我们很高兴看到这一切正在发生。
以色列并没有落后于其他国家,而是大语言模型领域的顶尖国家之一,特别是在支持本土语言方面。顺便说一下,我们也研究阿拉伯语,因为在以色列1000万公民中,800万是犹太人,200万是阿拉伯人,所以我们也想为阿拉伯裔公民提供阿拉伯语服务,这也是犹太人和阿拉伯人合作的桥梁。值得一提的是:我们的项目是一个非常成功的案例,展示了犹太人和阿拉伯人如何高效合作。
问:在人工智能发展进程中,全球有竞争也有合作,那么你是怎么用人工智能建设一个有更多合作的世界?
Avner Algom:我觉得在这个领域,我们有很多合作机会。
第一,找到对方都能受益的共同目标。
比如,如果我们做研发,为了共同目标进行技术方面的联合研发,让双方都能受益,这就是一个很好的例子。举例来说,我们之前做的项目,是对希伯来语和阿拉伯语文本进行标注,双方的语言质量都得到了提升。
第二,翻译方面,提升希伯来语、英语、阿拉伯语、汉语等语言之间的翻译质量。这有助于在人们之间建立更好的信任和沟通,同时也能创造商业机会。
比如,如果我们能实现希伯来语、阿拉伯语、英语之间高质量的合同翻译自动化,服务商业需求,就能帮助开拓新服务,让流程更高效更快速。另外,还能自动生成销售和营销内容。比如,我在以色列用希伯来语营销某个产品,如果我想要把这个产品出口到阿拉伯国家、中国或者其他地方。如果技术能自动生成高质量的销售和营销内容,而且效果好,这对交易达成会很有帮助。
第三,实现互联网上的实时交流。比如,如果我们在线视频通话,你说中文,我说希伯来语,我们一起交流合作,这会很有帮助,我们就不需要翻译了,而且能更好地理解彼此。甚至能理解你在文化层面的意思。因为系统会从文化角度理解你使用的词汇含义,这样我能更好地理解你,你也可以更好地理解我。所以,对于在线的实时交流,让我们能在上海和特拉维夫之间直接对话,这将非常方便。
以上这些研发工作都可以成为共同目标,大家都明白,这对每个人都有益,我们可以为此组建联合团队。
问:中国和以色列长期以来在人工智能等高科技领域保持着对话与合作。作为一名以色列人工智能创业者,你如何看待中国人工智能市场?你的研究和技术在中国有哪些应用场景和商业机会?如何实现双方的对接?
Avner Algom:我认为在以下几个方面可以深度合作。

问:鉴于FT中文网在全球华语世界的影响力,你想对中国读者说些什么?你对中以关系有何展望?
Avner Algom:作为一名在人工智能领域工作的以色列企业家和技术专家,我认为中以关系不仅关乎外交或贸易,更是一个造福人类的共享创新机遇。
以色列带来了突破性的思维:小团队用有限的资源解决难题。
中国带来了富有远见的规模:能够快速将创新转化为基础设施。
携手合作,我们有可能共同开发符合伦理道德、行之有效且影响深远的人工智能——从医疗健康到气候,从教育到老年护理。
(注:王英良,复旦大学博士,中开国际事务(NEIA)评论与研究主笔,目前正在推动辐射全球的“一带一路百人百访”栏目,力求以新颖的视角呈现世界与中国互动的信号与动态。微信号:porsche910114。本文仅代表作者个人观点。责编邮箱bo.liu@ftchinese.com)