第373章 羞於与之为伍!&惊艷且头疼(2 / 2)
洛川越想越靠谱,索性把王胖子喊来一块商议。
一旁的宋锦,以及另一边的陈诗瑶,望著凑在一起嘀嘀咕咕,不时发出阵阵奸笑的哥俩儿,十分默契的扯了扯好看的嘴角。
羞於与之为伍!
几日后。
企鹅羊城研发中心。
会议室內。
张晓龙鬍子拉碴的坐在首位,不动声色的扫视著房间內眾人,面色异常难看。
他怀疑队伍中出了一个叛徒!
今天上午,微信更新了一项新功能,“摇一摇”。
与他们正在开发的“l一l”,不能说十分一样,也至少有八分相似!
哪儿会有这么巧的事儿!
但也不对啊。
他们才刚立项一周而已。
即便极光的研发实力很强,也不可能在这么短的时间內,將其开发得如此完善。
到底是哪里出了问题
思索半响,张晓龙也没想出个所以然,只得暂且压下心头烦躁的情绪,强迫自己回归理智。
当务之急,是分析微信此次拋出的几项新功能。
比较重要的有两项。
其一自然是“摇一摇”。
这项功能,算是“附近的人”的进阶版,可进一步降低陌生人社交的门槛,激活社交场景,提升用户的新鲜感及活跃度。
其二,“语音消息转文字”。
功能如其名。
相比於“摇一摇”,这项功能,还要更加让张晓龙惊艷且头疼。
看似简单,实则技术含量极高,且麻烦得很。
深入解析后可发现,微信是通过某种,多重加密过的分布式语音识別引擎,將语音信號切割为50s片段,而后利用极光云的强大算力,將其实时转写为文本。
准確率更是高达92%以上!
即便是方言,准確率也在85%以上!
如果让他们开发的话,单是確定技术路线,调整微聊架构,开发语音识別引擎,就需要至少68个月。
此外,还需要大量数据进行训练,提升准確率,至少又要耗去46个月。
这还是在能申请到,集团已经开发至中期的云计算平台的算力资源的情况下。
即便如此,也很难保证,普通话的准確率,能达到85%以上。
当前主流的语音识別技术,仍为g-h框架,准確率普遍在80%左右。
而极光採用的,应该是“悠米智能助手”自研框架的变种。
全球范围內独一档的水准。。
语音识別引擎研发完成后,还需要將其集成到,集团的云计算平台之上,以实现即时快速语音识別。
再加上后期的联调与测试,至少又要耗去大半年。
也就是说,在资源充足,且技术难题顺利解决的情况下,他们也至少需要1620个月左右的时间,才能追上微信现在的水平。。
即便將標准放到最低,极致依赖开源工具,使用公开数据集,仅支持安静环境短语音,准確率在80%左右,也至少需要半年以上的开发周期。。
更要命的是,这项功能,看似平平无奇,但却远比“摇一摇”还要重量级,他们不开发还不行。。