吴恩达表示,Deep Speech 的成功很大程度上要取决于百度规模庞大的基于 GPU 的深度学习基础设施。GPU(图形处理器)往往是偏数学型计算的首选。许多深度学习系统都采用 GPU 避免通信瓶颈(不过微软的深度学习系统Adam 却走了不同的路线),但是像百度这样大规模的设施却是少见的。

吴恩达与妻子Carol Reiley
Deep Speech 的基础是某种递归神经网络(RNN),这种递归神经网络经常被用于语音识别和文本分析。
现在百度的语音识别技术已经达到95%,但是95%是不够的。很多人没意识到95%的准确度到99%的准确度带来的不是量变是质变,是从你偶尔使用语音变到常常使用做到更自然。做到99%准确,将彻底改变人与设备交互,这个技术的进展让我们对人与设备全新交互充满信心。
虽然人脑的学习与机器的学习还有很大的区别,但是人工智能必定越来越深入的渗透进我们的生活。吴恩达或许也将继续引领百度、中国的人工智能发展。
标签:服务器









