在AI的世界里,每个角落都藏着惊喜,就像魔法师的帽子,你永远不知道下一秒会跳出什么。想象一下,当你打开一个语言学习应用,它不仅懂你的语言,更懂你的心思;当你与一个AI伙伴对话,它不仅倾听你的心声,还能给你心灵的慰藉。没错,这些听起来像是科幻小说里的情节,但今天,它们已经变成了现实。Sami、李神龙和贾子健,这三位来自GFSA谷歌出海加速器项目的嘉宾,将带你走进一个由AI驱动的创新世界。在这里,AI不仅是技术的体现,更是情感的桥梁,是个性化服务的魔法师。
受访嘉宾:
Sami Kizilbash- GFSA谷歌出海加速器项目全球负责人
李神龙 - GFSA 谷歌出海加速器项目学员代表,心纪源创始人
贾子健 - GFSA 谷歌出海加速器项目学员代表,天天进步CEO
“我愿意把在中国的 AI 创业的生态系统称为真正应用人工智能”
Q:在AI的大趋势之下,硅谷的创业方向和亚洲以及东南亚是否有一些比较显著的区别?
Sami:确实是非常不一样的。在世界不同市场的创业中心,人工智能被采纳以及被应用的方式都是不一样的。其实我对于中国的创业的生态系统是感到非常开心的。我愿意把在中国的 AI 创业的生态系统称为真正应用人工智能。
为什么这么说呢?首先,当这些初创企业有了一个有关 AI 方面的商业点子的时候,他们能够快速实验,快速推向市场,节奏是非常快的。但是在整个过程之中,又是以一种非常负责任的态度,以一种审慎的态度方式去做的。另外整个市场给予的支撑是非常够的,从政府的公共的服务的体系,从私营商业的领域,以及消费市场的领域,都实现了三方的支持。
Q:东南亚那边会有区别吗?
Sami:其实我本人就是在新加坡工作,所以我对于东南亚的情况可以和您交流一下。有一点就是从我们市场划分的角度来说,你会把东南亚叫做一个地区。但事实上在这个地区中有不同的国家,每个国家的政府不一样,文化语言都不一样。所以如果你要在东南亚做 AI 创业的话,战略性的第一个要做出来的决策就是你选择哪一个东南亚的国家开始。然后再慢慢拓宽业务的足迹。但是如果你是在中国的话,就完全不一样了。中国虽然地域非常辽阔,但是是一个统一的语言和整个的监管政策,是国家层面的,是统一的。所以事实上,这就是对于在中国创业来说,市场大,还有语言、文化、监管政策统一的,所以和东南亚是不一样的。
Q:中国的这种 AI 应用出海方面,中国企业的优势在哪里?以及他们的出海过程当中会遇到哪些共性的问题进行?
Sami:事实上根据我的经验,中国出海的这些企业,他们的优势在于什么呢?因为他们来自于中国的这样大的市场,所以快速的做大做强对于这些中国的企业来说,绝对是他们非常显著的优势能力。通常,中国初创企业所提供的服务是非常可靠的。因为他们的技术已经经过了大用户数量。而且,他们的系统或者他们的应用通常都是能够快速进行当地语言本土化的。因为内在的系统已经在这方面进行了设置,所以是快速可调的。第三点就是速度,可以说在世界上没有其他的企业能比得上中国初创企业的速度。我认为这对全球的企业家都是非常好的值得借鉴的点。
谈到共同的挑战,其实当然不光是针对中国,对于任何一个要出海的初创企业,任何国家都是这样的,那就是当地的这个监管环境,这个是非常大的挑战。尤其是当你要做金融医疗这样强监管的行业的时候。那你一定要了解当地的监管的政策,顺利的走过,根据对应的流程,你要获得相应的手续,对吧?所以我们做的一件事情,就是把中国的企业家和他们要去的海外市场的本土的导师构建桥梁,让他们去对接。从导师那儿中国企业家能够获得当地市场很多的知识,从而能够快速进入到这个市场,来实现自己商业化的目标。
Q:在中国有十家明星公司进入了 GFSA,您选择这十家公司的标准是什么?Google 在硅谷的加速云项目,是否也是同样的标准的?在硅谷里面的明星公司也是一样的标准吗?
Sami:首先GFSA选择入营企业有通用的标准。但是针对不同的国家的创业中心,有一些针对这个国家的量身定制的标准。比如说在中国首先我们要看这个创始团队,领导者,这是很重要的衡量的标准。第二点就是我们会看,这家企业是不是已经建立了比较扎实的用户群,还有更好就是已经有收入了,或者已经吸引到投资了。
现在这个阶段,我们挑选创业企业,是有要出海的战略的。这个是我们选择的一个标准。这很明显和我们在美国硅谷挑选明星创业公司的标准就不一样了。我们在硅谷挑选的不是要出海的,而是要聚焦于在国内的,也就是美国市场做大的企业。而且我们会看这些企业家们对谷歌技术的了解程度。我们谷歌技术是不是对他们业务有助力。而且比如说在中国挑选的这十家的明星企业,他们来自于不同的行业,他们是互补的。所以我们会考虑到这些企业组合的多元化,背景互补的情况。
“我们应该聚焦让AI做那些人类做不到的事情”
Q:怎么样借助 AI 去迅速的去掌握整个学习者的状态,然后并迅速的去定制学习风格,学习计划?目前在全球各个地区里面,我们的优势地区以及目前的数据表现如何?
贾子健:我们把这个问题看成两方面,我们管这个问题叫个性化学习路径,一方面它来自于学习者的内容,一方面我们来自于对于学习者水平的认定。关于 content 部分,用户可以去创建自己的场景,以及Talkme会匹配最适合用户的学习目的所在的场景,比如说是为了工作,为了旅游,还是为了去 Interview 等等,会有用户自己的学习路径,以及用户自己的个性化的薄弱点的反馈和复查等。第二点就是关于用户的学习水平,我们做了非常详细的基于欧洲语言体标准 CEFR,这是一个全球非常著名的标准。我们基于这个标准实时评估用户的语言水平,我们用到了非常多的 AI 的技术,保证我们说出的内容是符合用户语言水平。
我们现在整体上的重点运营区域集中在亚太、港澳台、日韩以及美国市场,我们在这些市场目前的排名都是比较靠前的。经常出现在 App Store 以及 Google Play 的 Education 的前列。目前全球已经有个将近十几万的注册用户,并且我们每天都是正收益的,我们每天的 ROI 都是大于一的,商业模式已经跑通了。最让我们开心的就是用户给了我们非常多的正向反馈,目前我们全球评分都是 4.8~4.9 分,这让我们前进的更有动力。
Q:MoodTalker 是 AI 心理领导,因此可能会涉及到文化,对这种平台出海而言,会涉及到不同的地区的文化差异,以及使用方式,以及心理上,或环境上有一个压力,有没有区别?
李神龙:谢谢这个问题。我可以分享一下经验。我们有2500万条第一人称中文语料的累计。所以我们对中文地区的情绪和情感是相对比较熟悉的。而在出海的时候,其实我们会明显发现,根据文化圈层和认知的不同,甚至要去重塑整个产品体系。
举一个例子。东方文化中会有一种情绪叫做委屈,既有不忿又是一种内耗,但这个情绪在英文中很难找到对应的单词。所以我们去掉了这个不常见的情绪,做了更多本土化。
第二个问题,在出海的合规化和本土化,包括数据安全、技术难点和用户洞察上,Google 给我们提供的帮助非常大。我们今年在申请出海创业加速器过程中,其实已经有面临一些技术选择上的问题,还有敏感数据的储存问题。 Google 的小伙伴们提供了很多意见和帮助,这也加速我们整个出海的过程。
Q:根据你们的用户反馈或者说你个人的经验和观察,现在你们在面对对来来的时候,相比传统的心理咨询师是会更开放还是更保守,有什么具体的变化。这种变化会带来一种新的咨询或者沟通的模式吗 ?
李神龙:这也是我们非常聚焦的问题。从用户的反馈和我们的观察来看,在初见面、初识的阶段,用户对AI更加开放的心态,更愿意和好奇去谈论,信任门槛相对人类是降低的。但随着交流的推进,情绪和信息密度开始提升时,AI 和人类交流方式和习惯的不同会被放大。这个差异感,使得很多用户并没有办法保持很好的对话体验,这也是我们需要聚焦技术力量去提升的。
第二个,您讲到现在的人机交流是否能带来新的咨询模式。我的看法是,传统的心理咨询的服务形式,是因为人类只能通过文本或者口头对话进行实时信息交流。基于这种交流方式,才诞生了服务形态。如果撇除对话这个固定形式,AI 生成的效率以及推理的效率远远要超过人脑。
我们应该聚焦让AI做那些人类做不到的事情。比如我们现在致力于情绪的可视化,还有情绪底层需求的翻译,用AI极速解读和翻译出人们心中真正的想法,然后再生成可以被看见的东西。这是人类做不到的。而且我坚信往深处探索,可以给人类原来的心理科学研究提供更多视角和益处。
Q:两家企业在选择用哪一家模型的API的时候,比较看重的标准有哪些。以及你们未来希望看到大模型哪些能力的提升,会对你们做产品会有很大比较大的帮助。或者说还是说现在这个已经差不多够了?
贾子健:实际上在选择模型的时候,我们会根据用户需求去决定到底使用哪个模型。比如说我们在非常多的场景,目前实际在用的就是Gemini可以满足这个场景下的部分的功能。但有些场景下我们用的就是其他的模型,它可以满足用户聊天体验更好之类的,那对于我们来说,一方面是我们所面临的用户要做要需要的事情。另外一方面就是我们希望给用户提供的体验一定是最顶级的。
其实我们对于自己的未来,有两个方面的诉求,也就是基于模型端。一方面就是我们也在筹划的版本当中,比如会有多模态的诉求。第二点就是我们希望未来能够结合端侧有很多联系,而不仅仅是云端的模型。因为端侧更快,算力更有保障。比如说可能谷歌后面要出的手机,它会有端侧的模型,就这种我刚才看到那个pixel上面也有端侧模型了。像这种场景就是我们非常喜欢的。然后结合本地的算力去完成很多这种体验性的工作,这个是我们特别需要的。
李神龙:这个问题的话,我们的答案大致相同。第一个可能是用户体验和用户需求,大模型特点必须要满足业务场景和用户需求。比如情绪的识别翻译,和回答的共情化。第二个是性价比,我们作为创业者肯定还要考虑,在目前整个算力供给还没有到普惠的情况下,如何去维持可持续性的发展。
关于未来展望,我们也在密切关注多模态。文本只是情绪输入信息的一部分,一种方式。面部表情、声音的生理指标等的拓展,都对情绪的输入和识别分析有很大的帮助。包括AI的回应也会有更丰富的形式,这对我们来讲是非常大的提升。