百度人工智能又完成了一个“小目标”,这次弄了个语音转录应用

发布时间:2017-04-10 10:58   点击量:5602

自从百度把人工智能当做核心发展战略之后,这方面的进展也是神速。

3 月 13 日,百度宣布推出一款名为 SwiftScribe的网页版应用,它能够利用人工智能技术把语音文件进行转录,感兴趣的可以去试试看。


长期以来,人们在转录语音文件时,常常需要通过手动逐字录入。但是 SwiftScribe 这款应用通过集成百度自主研发的语音识别技术以及功能简单的编辑工具,可以帮助人们实现语音文件快速、便捷的转录,提高生产效率。

据百度介绍,SwiftScribe 依托的核心技术来自百度的新一代深度语音识别系统—— Deep Speech 2。通过利用长达数千小时的标注语音数据进行训练Deep Speech 2 可以不断学习从语音中识别特定的字或词。


此外,百度还通过直觉快捷键以及人机交互技术来解决语音录入的不连贯问题。

对于那些职业速录师来说,SwiftScribe 能成为他们的生产力利器。对于一段时长为一小时的语音文件来说,常规情况下需要 4-6 小时去进行人工转录,并且每分钟的转录成本约合 1 美元。如果使用 SwiftScribe 的话,所用时间能缩短差不多 40%

不过,虽然人工智能可以提高生产力,短时间内还没办法完全取代人类。在 SwiftScribe 完成初步的语音转录后,还需要人工去检查大小写、标点符号、错别字等等。

据百度的项目经理吴甜介绍,SwiftScribe 目前仅支持一小时以内的语音文件转录,但团队还在对应用的功能进行进一步开发,以后可能会增加对视频文件的语音识别、支持更多文件格式以及自动添加标点符号等功能。

从第一代的 Deep Speech 到第二代的 Deep Speech 2,百度已经在深度语音识别技术上深耕多年。2016 年,百度推出了使用 Deep Speech 系统的 TalkType,为 Android 键盘添加语音录入功能。同年,百度的深度语音识别系统 Deep Speech 2 还入选了美国《麻省理工评论》的 2016 年十大突破技术。


Powered by JPaaS  京ICP证030173号 京公网安备11000002000001号   ©2017Baidu 关于百度