Microsoft PH Modern Business Day 2019 - Highlights
Microsoft đã trở thành công ty đầu tiên trên thế giới phát triển phần mềm nhận dạng giọng nói chính xác hơn con người. Trong bài báo Đạt được sự bình đẳng của con người trong nhận thức lời nói đàm thoại Thứ hai, phần mềm đã tạo ra các bản sao có lỗi ít hơn một nửa phần trăm so với nỗ lực của con người, điều đáng kinh ngạc là xem xét mọi người hiểu được lời nói tốt như thế nào. Bước đột phá mở ra cơ hội cho A.I. trợ lý chính xác hơn bao giờ hết.
Nó ấn tượng như thế nào đến nay công nghệ đã đến trong một khoảng thời gian ngắn như vậy. Cách đây quá lâu, nhận dạng giọng nói máy tính là một lĩnh vực kỳ lạ dường như xa vời vô vọng. Xem bản trình diễn phần mềm phát biểu Windows Vista này từ năm 2006:
Nhóm nghiên cứu đã sử dụng bài kiểm tra 2000 của Viện Tiêu chuẩn và Công nghệ Quốc gia (NIST), được sử dụng trên toàn ngành để đo lường độ tin cậy của phiên âm lời nói. Một cuộc trò chuyện diễn ra giữa hai người tham gia qua điện thoại, lần lượt, trước khi kịch bản kết quả được so sánh và kiểm tra so với chính tả từ điển.
Trong phần tổng đài, nơi lần đầu tiên hai người lạ nói chuyện, tỷ lệ lỗi của con người là khoảng 5,9%, trong khi ở phần gọi về nhà, nơi hai người biết nhau nói, tỷ lệ lỗi là khoảng 11,3%. Phần mềm Microsoftiên ghi được tỷ lệ lỗi thấp hơn 0,4 phần trăm.
Bước đột phá này sẽ giúp mang lại những hình thức mới về A.I.. Vào tháng 8, sinh viên Joshua Browder đã gỡ bỏ chatbot DoNotPay của mình, có thể giúp những người vô gia cư nhận được tư vấn pháp lý miễn phí. Kết hợp với những tiến bộ công nhận, nó dễ dàng hình dung ra một tương lai nơi mọi người nhờ trợ lý ảo giúp đỡ về nhà ở bằng cách trò chuyện thường xuyên với máy tính của họ.
Ở giai đoạn này, các nhà nghiên cứu đang xem xét làm thế nào nhận dạng giọng nói do A.I. cung cấp có thể đưa ra phản ứng thông minh hơn. Sensay, một A.I. từ phòng thí nghiệm đằng sau Siri, sử dụng các khả năng nhận dạng nâng cao để phát hiện xem người dùng có cảm thấy tức giận hoặc bối rối hay không, thay đổi câu trả lời cho phù hợp với tình huống. Xóa bỏ rào cản nhận dạng giọng nói dễ bị lỗi, tạo ra những cơ hội mới thú vị cho hỗ trợ ảo.