字:
关灯 护眼
三月小说 > 重生87:开局截胡港岛女神 > 第1906章 平衡的艺术2

第1906章 平衡的艺术2

    贾瀞雯看着那份测试报告,眉头皱起来。

    百分之六十二,意味着每三句话里就有一句识别错误。

    这样的产品,根本没法用。

    “瓶颈在哪儿?”她问。

    “数据。”张涛说,“语音识别需要大量标注好的语音数据。

    我们没有这方面的积累,要从零开始收集。

    还有算法,现有模型对噪声、口音的适应性很差。”

    贾瀞雯记下这些,当晚就汇报给了陈浩。

    陈浩听完,沉默了一会儿。

    “百分之六十二,比我预期的好一点。”他说,“我本来以为会更差。”

    “那怎么办?”贾瀞雯问。

    “别急。”陈浩说,“语音识别是长期工程。

    先收集数据,优化模型。

    我把手头一些资料发给你,可能有用。”

    几天后,贾瀞雯收到一个压缩包。

    里面是几十篇论文和技术文档,都是关于语音识别的最新研究。

    有些是英文的,有些是中文的,还有一些是手写的笔记——陈浩的字迹。

    她把这些资料转给张涛。

    张涛看了之后,兴奋地打电话来:“贾总,这些资料太及时了!有几篇论文正好解决了我们遇到的问题。”

    接下来的几个月,语音搜索团队边学边做。

    数据从几万条积累到几十万条,模型从简单到复杂。

    准确率从百分之六十二慢慢爬到百分之六十七、六十九。

    但到了百分之七十,又卡住了。

    “七十是个坎。”张涛在评审会上说,“再往上,需要的计算量和数据量成倍增加。

    我们现有的算力不够,数据也不够。”

    “需要什么?”贾瀞雯问。

    “至少再翻一倍的服务器,还要更多的标注数据。”张涛说,“投入可能要翻番。”

    贾瀞雯算了一下。

    翻番意味着把移动广告联盟的全部盈余都投进去,甚至还要从其他项目抽资源。

    她犹豫了。

    当晚的视频,她把这个难题抛给陈浩。

    陈浩听完,没马上回答。

    他拿起笔,在纸上画着什么。

    “瀞雯,我想到一个思路。”他说,“传统的语音识别,是把声音转成文字,再用搜索去匹配。

    但有没有可能,跳过一个环节?”

    “什么意思?”

    “直接建立声音特征和搜索结果之间的关联。”陈浩说,“比如用户说‘天气预报’,系统不是先识别成‘天气预报’这几个字,再搜天气。

    而是直接从声音特征匹配到天气这个意图。”

    贾瀞雯想了想:“听起来很抽象。

    技术上能实现吗?”

    “需要算法创新。”陈浩说,“我写个框架发给你,让团队看看。”

    两天后,一份长达二十页的手写文档发到贾瀞雯邮箱。

    陈浩用铅笔画的流程图,密密麻麻的注释,还有一些数学公式。

    她转给张涛。

    一周后的评审会,张涛兴奋得声音都在抖。

    “贾总,陈总的思路通了!”他指着屏幕上的新数据,“我们试了新的算法框架,准确率直接跳到百分之七十六!而且计算量还降低了百分之三十!”

    “怎么做到的?”贾瀞雯问。

    “他提出的那个端到端模型,跳过了中间的文字转换环节。”张涛解释,“声音特征直接匹配用户意图,少了中间步骤,误差也少了。

    我们还在优化,理论上能到百分之八十以上。”

    会议室里一片惊叹。

    贾瀞雯看着那些数据,心里涌起一种复杂的感觉。

    陈浩不在现场,不参与日常研发,但他总能点破那层迷雾。

    当晚的视频,她把这个消息告诉陈浩。

    “团队说,你的思路通了。”她说,“准确率跳到百分之七十六。”

    陈浩笑了:“是他们技术好。

    我只是画了个草图。”

    “草图就够了。”贾瀞雯说,“每次我们卡住,你总能找到方向。”

    两人隔着屏幕对视。

    陈浩的眼神很温和。

    “瀞雯,你知道为什么吗?”他说,“因为我在外面,看得更清。

    你们在水里游,我在岸上看。

    哪里水深,哪里水浅,哪里该拐弯,我看得比你清楚。”

    “那你什么时候下水?”贾瀞雯问。

    陈浩摇头:“我不下水。

    我就该在岸上。

    你游你的,我指我的。

    这就是我们的分工。”

    贾瀞雯想了想,笑了。

    是啊,这就是他们的分工。

    她带着团队在水里游,他在岸上看方向。

    一个负责执行,一个负责远见。

    少了谁都不行。

    “好。”她说,“那我继续游了。”

    “游吧。”陈浩说,“遇到看不清的地方,就喊我。”

    挂了视频,贾瀞雯站在窗前。

    窗外是北京的夜色,万家灯火。

    她想起五年前,语音搜索还只是一个概念。

    现在,团队已经能做出百分之七十六准确率的原型。

    五年后呢?也许用户真的可以对着手机说话,百度就能听懂。

    这条路很长,很难。

    但方向对了,就不怕慢。

    她转身回到办公桌前,继续看那份技术报告。

    窗外夜色渐深。

    办公室里,键盘声轻轻响起。

    【跪求礼物,免费的为爱发电也行!】
『加入书签,方便阅读』