搜狐科技 智能语音商业化如何破局 三位专家在搜狐科技沙龙上支了这些招
7月6日下午,由搜狐科技主办的中国创新公司100沙龙第二期成功举办。清华大学人工智能研究院听觉智能研究中心主任方正教授、声智科技联合创始人兼首席知识官常乐、科大讯飞AI研究院副院长陈志刚共同探讨了智能语音技术的发展趋势,并分享了他们对智能语音商业化的思考。
“中国创新公司100强”是搜狐科技今年打造的一个栏目,主要聚焦5G、AI、芯片、制造、出行、零售、社交等领域的技术创新和商业模式创新,深度挖掘相关产业和优质创新公司的价值。
目前处于第三次浪潮的AI正在经历加速发展,AI技术不断突破,进入应用规模爆发的临界点。智能语音作为人工智能领域最成熟的技术之一,近年来应用迅速。搜狐科技此前推出了该领域第一份人工智能行业榜单。未来将围绕计算机视觉、机器人等领域推出一系列榜单和深度报道。
在本次沙龙中,方正教授认为既要重视语音技术,也要重视市场需求分析。但单一技术很难解决市场问题,融合发展是大势所趋,但不能为了融合而融合。他还呼吁技术和市场要有良好的互动,智能语音行业要避免恶性竞争。
常乐表示,智能语音赛道将在大浪淘沙后呈现几何倍数的发展趋势。在智能语音未来的应用前景上,2B领域将走在c端的前面,拥有更广阔的市场空,良好的市场应用前景也能引导和推动新一轮的技术创新。
陈志刚在分享中提到,智能语音技术的算法和数据急需突破,联合建模是最好的方式。在激烈的市场竞争中,企业要选择正确的赛道,做出差异化,拥有核心技术的创新思维模式。
▲清华大学人工智能研究所听觉智能研究中心主任方正教授、盛智科技联合创始人兼首席知识官常乐现场参加沙龙
数据和算法需要突破,不能集成集成
目前很多观点认为人工智能处于深水区,根据Gartner技术曲线称之为泡沫幻灭期。方正认为,相对成熟的语音领域存在严重的同质化问题,即技术上的方法同质化,这也导致了市场的恶性竞争。
“我们有时过多地跟踪别人的技术,而忽略了做深入的分析。比如现在流行的深度学习都是用别人成熟的方法,很少找到正确的手段去解决问题。”他解释道。
从技术发展的要素来看,数据、计算能力和算法是离不开人工智能快速发展的三个基本要素。陈志刚认为,智能语音仍然需要在数据和算法上有所突破。在许多情况下,数据会受到各种限制。在特殊场景下使用不频繁,在一些专业场景下数据本身就比较稀缺。
在算法方面,陈志刚提到还有一些硬骨头,比如前端声学降噪算法、前端声学信号处理算法、麦克风阵列算法等。这些算法的突破是解决当前语音难题的必由之路。
目前很多观点认为,单一的技术已经不能支撑人工智能企业在市场竞争中取胜,多模态融合成为趋势。
方正说我们应该重视技术,但是我们不应该过分依赖它。“技术的发展离不开市场的土壤。市场需要的是解决问题的能力和解决方案。用单一的技术很难解决,这也是一些AI公司面临困境的重要原因。”
同时,他强调,市场真正需要的是解决这些问题的综合解决方案,要利用其特点找到一些不同的技术进行整合。这种集成应该是解决问题的集成,面向服务和面向用户的集成,不能为了集成而集成。
长乐认为,语音、图像、大数据等技术可以有效融合,但前提是解决市场需求和用户需求。“对于我们这些做技术的人来说,我们绝对不是指通过研发技术实现自给自足,而是希望技术能够有效解决所有用户真正的痛点需求。”
然而,智能语音的发展还有很多问题需要解决。常乐说,理论上还有很多突破,比如对耳蜗的研究还不够深入;技术和市场应用创新也是瓶颈,但它们是互补和螺旋式上升的过程。良好的市场应用前景可以引导和推动新一轮的技术创新。
陈志刚赞同技术融合的战略。他认为,以语音学为基础的自然语言理解、视觉、知识建构、推理技术,以及跨模态信号联合建模和感知认知一体化的策略,都不是简单的技术组合。
他说,在这个过程中,要清楚了解每一项技术的水平,看哪些技术在某个层面上有融合价值,选择合适的应用场景,对场景进行深入分析,然后定义问题。联合建模可能是最好的场景解决方案。
声音轨迹会被大浪冲走,要避免恶性竞争
人工智能作为一种技术或工具,只有真正落地于实际场景中才能发挥自身价值,这也离不开技术产品化和产品市场化的过程。在这个过程中,很多智能语音企业不断尝试转型,比如通过制造AI芯片和操作系统向上游延伸,或者通过制造智能硬件直接向下游渗透。
对此,方正表示,企业必须做自己擅长的事情。根据一些战略需求或市场需求,需要进行主动转型,而有些企业在资本的压力下是被动转型,这是不可取的。
陈志刚认为,这在一定程度上是必然趋势,可以加速产业发展,特别是在当前国际形势下,加大自主研发投入,避免被卡脖子。
常乐表示,智能语音赛道目前已进入泡沫期,大浪淘沙后,将呈现几何倍数发展的趋势,留下市场所需的新技术、新应用。“在这样大的市场环境下,企业在不同领域进行探索是一件非常好的事情。即使他们可能面临瓶颈,但背后也有巨大的机会。”
在商业模式上,人工智能领域基本形成了四条路线:卖技术、卖产品、卖服务、卖解决方案。方正认为,商业模式的质量取决于三个因素。一是市场需求,是否能把握痛点和痒点;二是技术的成熟度和领先性;三是行业竞争程度。
陈志刚说,好的模式适合公司的发展,每个公司在不同的发展阶段都会有适合自己的商业模式或组合。他提到,目前国内很多优质的AI产品或解决方案或技术提供商更容易打动客户,真正了解行业和用户的企业可以开发一些技术或产品。
在具体的落地路径上,常乐认为,企业在C端落地时,不应该在意用户是否感知到这项技术有多先进,而应该关注产品本身能带来什么样的价值。她还表示,2 B市场孕育着2C看不到的价值,智能语音将在2B领域走在C端前面,市场应用空会更多。
▲科大讯飞AI研究院副院长陈志刚在线参加沙龙
陈志刚认为,智能语音之所以没有在医疗和工业行业得到应用,是因为这些领域在数据积累和行业基础方面相对滞后,包括信息化水平;另一方面,该技术可能不处于非常有用的状态,这需要一个迭代优化过程,根据每个行业的应用特点,这可能需要几个月到几年的时间。
最后,三位嘉宾分享了对智能语音行业竞争的看法,其中互联网科技巨头不容忽视。方正表示,巨头在资金、人才、数据、算法、计算能力等方面有很多优势,但并不意味着小企业就没有发展空,如果投资方向正确,用对了力量,在竞争中就会处于有利地位。他还呼吁,智能语音在中国现阶段还是一个比较小的行业,要做大就要从一开始就避免恶性竞争。
常乐认为,智能语音市场刚刚兴起,正朝着繁荣阶段发展。未来市场空的容量足够容纳很多企业,包括大企业和小而美的创业公司,但创业公司应该能在这个赛道上找到准确的位置。
陈志刚表示,在激烈的市场竞争中,企业要选择正确的赛道,拥有核心技术的产品创新思维模式。对于成熟的赛道,企业要么选择加入技术巨头的生态,要么做自己的核心技术和产品创新,但难度相对较大,需要颠覆性和开拓性,同时又有一定的技术壁垒。