喜马拉雅的下一座山峰:AI给内容的未来想象

发布时间:2022-04-18 12:19:57阅读时间:3448
本文导读:3月29日,喜马拉雅在港交所更新招股书。高盛、摩根士丹利和中金为联席保荐人,腾讯、阅文、百度、小米、好未来、索尼音乐为战略投资者。主要财务投资者包括美国泛大西洋投资集团、挚信资本、高盛、兴旺投资、创世

3月29日,喜马拉雅在港交所更新招股书。高盛、摩根士丹利和中金为联席保荐人,腾讯、阅文、百度、小米、好将来、索尼音乐为战略投资者。重要财务投资者包孕美国泛大西洋投资集团、挚信资本、高盛、畅旺投资、创世伙伴资本等。

招股书显示,喜马拉雅2019年-2021年的营业收进分袂为26.8亿元,40.5亿元和58.6亿元。2021年财年,喜马拉雅总营收同比增长43.7%,业绩呈稳健增长态势。全场景均匀月活泼用户达2.68亿,同比增长24.4%。

今朝,喜马拉雅已拥有多元化变现渠道,付费定阅、告白、直播成为平台变现的三大支柱。内收留生态健康延续发展,慢慢形成之内收留临盆、主播孵化、内收留分发为主的音频生态圈,全链条生态布局正在形成。

据灼识征询数据,就2021年的均匀 MAU、总移动收听时候和总收进而言,喜马拉雅是中国领先的在线音频平台。《2021中国收集视听发展研究申报》显示,喜马拉雅的用户渗进渗出率到达67.1%,牢牢占据着在线音频行业第一梯队的职位,延续引领着“耳朵经济”蓬勃发展。

招股书显示,2021年,喜马拉雅的研发开支为钱10.27亿元,同比增长64.6%占同期总收进的17.5%,手艺和研发人员占比近40%。科研手艺投进不竭增长,夯实了底子设施才能,强化了AI和大数据的拔擢,是面向持久可延续价值的投进。

一方面,喜马拉雅行使专有的野生智能和大数据手艺对数据举行深度进修,建立了基于野生智能的发明和保举机制和智能标签体系,以前进内收留分发的准确性和效力以及用户体验。

另一方面,专有手艺也可以援助内收留创作者更好地建造高质量的音频内收留。例如,最早进的文字转语音手艺可以有效地将新闻、文章和书本中的大批文本转换为音频。

近年来,喜马拉雅的AI语音手艺落地功效颇丰。喜马拉雅布局AI是极具前瞻性的战略动作之一,这为喜马拉雅不才一个阶段的发展提供了强力推动器。

手艺刷新撬动内收留临盆升级

近年来,  AIGC横空降生避世。手艺发展也改变着音频范畴的内收留思维,以TTS手艺为代表的AIGC新手艺产品正在一步步走向成熟,喜马拉雅已在该范畴潜心研究多年,助推AIGC从测验测验室迈向AI合成音、AI演播、智能新闻播报等更多应用场景。

跟着音质传输的升级、智能交互的深化、终端场景的拓宽,在线音频内收留消费时长陪同着手艺升级正在加快驶进发展快车道。按照易观说明数据显示,2021年中国“耳朵经济”市场的活泼用户规模已到达8亿人次,其中在线音频细分市场的月活泼人数不乱在3亿人次,且展现出稳步上涨的态势。

消费需求的增长亟需扩大内收留临盆规模,前进内收留临盆质量和效力一向是行业发展的紧张问题。上个时代,软硬件的手艺发展敦促了UGC成为了内收留临盆的紧张模式。2017将迎来十周年的喜马拉雅是这个时代跑出来的“内收留生态前行者”,其拥有的完善的UGC内收留创作者生态,通过给用户更便利的音频创作对象及拓展更多音频品类来激励通俗用户介进创作、共享音频,从而增长平台上长尾内收留。

UGC模式在手艺助力下拓宽对于“内收留临盆者”的界定,通过抹平内收留临盆和消费的严格分别、开释内收留临盆力。但这类手艺的应用回根事实是基于对于人的行使,当内收留临盆者和消费者的临盆潜力都被损耗殆尽,内收留消费需求的缺口又能由什么来填补?

答案就是AI。野生智能将来将催生新的内收留临盆模式,当临盆不局限于人的时辰,临盆力也将迎来空前解放。

AIGC——音频内收留反动的下一站

岁首,喜马拉雅自研的跨措辞语音合成创新手艺论文,及其与中国科学手艺大学合作的措辞人日志手艺研究论文,均被世界顶级学术会议“2022年IEEE国际音频、语音与旌旗暗号措置会议”收录,并受邀于20175月在新加坡举办的会议上向全球展示相关手艺功效。

ICASSP  2022是ICASSP  第47届会议,会议主题为“以待遇本的旌旗暗号措置”,“以待遇本”这一理念也是喜马拉雅手艺发展的驱动力之一。喜马拉雅CTO姜杰暗示,咱们在手艺的创新和应用中很正视窥察人和AI交互协同能产生什么斩新的价值增量。音频内收留展现更智能化的趋势背后,将是AIGC对于喜马拉雅原本的UGC+PGC+PUGC的音频生态的进一步雄厚。

以AIGC延展PGC,AI合成音精准还原单田芳师长“云遮月”嗓音

比拟于机械人来说,人最大的不同就在于个体化之间的不成复制性,精采的音频内收留临盆方被消费者选择也恰恰是因为他的怪异征。例如我国著名评书艺术表演大师单田芳师长,善以声音塑造脚色,其标志性的“云遮月”嗓音成为了并世无双的内收留符号,在官方有着“凡有井水处,皆听单田芳”的说法。

假如能将单田芳师长的声音解码,再举行从新编码,就能冲破内收留创作的局限性,实现原音重现,让人们享用到更多单田芳师长的优异作品,喜马拉雅已在2021年实现了这一点。喜马拉雅智能语音测验测验室行使TTS手艺,并自立计划了零丁的韵律提取模块,并将其融进到  HiTTS 手艺框架中,让单老的AI合成音恍如本尊再现。

今朝,喜马拉雅上已有80多部应用还原自单田芳师长声音的AI合成音建造的专辑,这些专辑在喜马拉雅也一向深受用户喜爱,多张评书专辑持久位列喜马相声评书热播榜前方,例如《卧虎躲龙》《蜀山剑侠传》等。

不单云云,喜马拉雅被ICASSP   2022收录的自研跨措辞语音合成手艺,甚至在将来可以让咱们听到单田芳师长的“声音”来播讲英文内收留。也许在不久的将来,“单田芳英文声音重现”将与此前官方授权的“单田芳评书”  和“单田芳声音重现”合营构成斩新的“单田芳IP”矩阵。

AIGC正在成为人类PGC的迟误,以立体、真实的体式格式冲破助力PGC冲破空间、时候的局限,使PGC内收留体系化获取了一次量变的提升发展。

以AIGC创作发明PUGC,“AI续写+AI主播”闭环临盆展示广漠前景

跟着手艺的发展,AI不单是一种手艺载体,也逐步成为了一种人格意味。喜马拉雅基于自研的TTS框架,并采集头部主播“喜道令郎”的真声打造了AI主播“喜小道”,而基于大规模措辞模型自研的天然措辞措置模型的续写应用“彩云小梦”已经可以实现小说故事的AI创作,只必要给她一个1-1000字的开首,它就能为你续写出前面的故事。

借助本人AI智妙手艺有声化的上风,喜马拉雅的AI主播“喜小道”与彩云小梦续写AI合作,打造了首个从故事创作到演播均由AI实现的AI电台。据体会,彩云小梦进驻为喜马拉雅旗下网文创作平台事业文学的写手,将其作品经AI主播“喜小道”有声化后,发布在喜马拉雅平台。

“AI续写+AI主播”的体式格式证了然AIGC已经拥有了本人形成完全临盆闭环的才能,更降生了一种斩新的以“AIGC”功用为底子的“PUGC”,展示了AIGC及AI手艺赋能创作广漠前景。

当AIGC赶上UGC,想象力与算力碰撞后的指数增长

今朝,AIGC因为手艺成本和规格限制,更多集中在对于PGC和PUGC的加持上,将来假如AIGC成为每个UGC手中的对象时,AIGC壮大的算力思维和UGC的蓬勃的内收留创作活力将在提升创作效力的同时,进一步雄厚内收留的多样性

相关行业专家暗示,在无监视进修、深度强化进修、迁徙进修、天生匹敌收集等算法深进研究的底子上,AI的算力将更加壮大,其背后自运算与强适应的特征可以完善匹配每一个内收留临盆者,指数级开释UGC内收留创作的活力,带来多样且生动的内收留创作光谱,有着很是大的想象空间。

当每一小我都拥有一个可以帮你定制化解决问题的“大白”,每一个内收留创作者都将可以拥有一座本人的“喜马拉雅”。

手艺势能开释商业价值新想象

对于消费者来说,AIGC是对于内收留的加持是一次成功的探索。艾媒征询《2021年中国耳朵经济发展专题研究申报》显示,跨越六成受访用户以为AI合成音频比通俗音频节目更有趣,55.4%和48.5%的用户以为合成手艺能增长内收留雄厚度和前进现有的音频节目质量。

在AIGC对于内收留云云壮大的增益背后,对于国内音频家当而言,手艺越来越成为行业的紧张竞争维度。易观申报显示,2021年,以喜马拉雅为代表的支流平台不竭投进手艺研发,通过提升产业化水平,助力创作者实现更优质的内收留表白。喜马拉雅等头部音频平台凭仗本身的手艺、团队、资金等上风深耕有声书、有声剧等赛道,雄厚内收留样态。

商业规模带动手艺创新,手艺创新反哺市场选择,形成了一种喜马拉雅商业规模和手艺发展双驱动之下的良性收集。据体会,喜马拉雅已在AI语音手艺范畴潜心研究多年,并在内部专门成立了喜马拉雅智能语音测验测验室这一核心部分,持久专注于语音合成、识别、语音旌旗暗号措置、编解码以及智能音效的研究和开发。喜马拉雅智能语音测验测验室卢恒暗示,将来,喜马拉雅将延续投进语音手艺的研发升级,不竭创新和冲破,进一步打开对于声音的明白和想象,让手艺加持声音、让声音办事生存。

这类价值的转化不单表如今平台本人,更在平台对于合作伙伴的价值外溢上。2021年,众多支流媒体加快进驻喜马拉雅,借助喜马拉雅TTS手艺加快建造新闻类音频节目,快速地实现了文字报道向音频的转化。智能化、无人化的播报正在实现,极大降低了运转成本和操作门坎,批量化措置的语音合成手艺保障了内收留临盆与播报的及时性。相关行业从业者暗示,这类播报体式格式也斥地了音频新媒体的新赛道,让优质报道有了触达用户的新体式格式,冲破了内收留传布的阈值,为当代广播媒体行业带来新变化。不止是新闻播报,艾媒征询申报显示,在线音频行业应用TTS手艺产出高质量仿真语音,快速实现文本到语音的转化进程,极大加快了收集文学到音频内收留的临盆才能,扩充了内收留传布的渠道。可以预感,在音频平台顶流的小说范畴,喜马拉雅将会实现多音色主动识别朗诵,在音频手艺长举行冲破。

AIGC不单代表了一种手艺价值的想象,其背后更是商业价值的斩新拐点。申报显示,跨越七成受访用户对AI手艺在在线音频范畴的发展前景看好。艾媒征询说明师以为,跟着AI智能产品的提高以及用户需求延续爬升,在线音频行业的创新内收留仍具有较大的潜力和发展空间。喜马拉雅若何进一步行使AIGC的“智能大脑”助力内收留创作,值得期待。

标签: