Fireside chat: building on and contributing to Google’s open source projects (Google I/O '18)
Chatbots chính thức tấn công vào thị trường thương mại vào năm 2016. Slack hiện có một kho chatbot dành cho người làm việc chuyên nghiệp, Facebook vừa phát hành nền tảng Messenger cho họ (mặc dù vẫn đang tìm hiểu phải làm gì với họ) và Microsoft thậm chí còn tranh cãi về chatbot với bot Tay phân biệt chủng tộc của nó. Bây giờ Google đang bước vào phân khúc và họ hy vọng sẽ sửa chữa những sai lầm trong quá khứ bằng cách mở nó ra.
Google hôm nay đã công bố, nó thực hiện nghiên cứu về hai chương trình ngôn ngữ riêng biệt dành cho các nhà phát triển. Các chương trình có tên SyntaxNet và Parsey McPudeface (rõ ràng là một trò chơi trên tàu khoa học Anh mà internet muốn đặt tên là Boaty McBoatface) không phải là chatbot, nhưng chúng sẽ cung cấp các kỹ năng ngôn ngữ cần thiết để giúp chatbot trở nên thông minh hơn.
Theo tên của họ, Parsey McPudeface phân tích các câu tiếng Anh cho cấu trúc của chúng, trong khi SyntaxNet quy định một thẻ cho mỗi phần của bài phát biểu trong câu và cố gắng xâu chuỗi chúng lại với nhau. Đồng thời, cả hai chương trình đều có thể diễn giải các cấu trúc câu phức tạp hơn - không giống như bot Tay, về cơ bản chỉ lặp lại bài phát biểu đáng ghét trên Internet.
Ví dụ, Google nói rằng thật đơn giản khi máy móc phân tích một câu như của Alice Alice đã thấy Bob. Nhưng, với hai chương trình này, việc hiểu các câu phức tạp hơn - một cách dễ hiểu hơn là - Alice Alice, người đã đọc về SyntaxNet, đã thấy Bob trong hành lang ngày hôm qua, ví dụ.
Google cũng chỉ ra rằng con người đặc biệt nhanh nhạy và giỏi trong việc hiểu các câu dựa trên ngữ cảnh, trong khi máy móc có xu hướng rất chính xác.
Các nhà nghiên cứu đã viết trong bài viết trên blog, không có gì lạ đối với các câu có độ dài vừa phải - nói dài 20 hoặc 30 từ - để có hàng trăm, hàng ngàn hoặc thậm chí hàng chục ngàn cấu trúc cú pháp có thể. Một bộ phân tích ngôn ngữ tự nhiên bằng cách nào đó phải tìm kiếm thông qua tất cả các lựa chọn thay thế này và tìm ra cấu trúc hợp lý nhất được đưa ra theo bối cảnh.
Đối với một câu như của Alice Alice lái xe xuống đường trong xe của cô ấy, máy móc phải giải mã tích cực hơn rằng người nói không có nghĩa là việc đọc một cách ngớ ngẩn hơn rằng đường phố nằm trong xe Alice.
Có lẽ các kỹ sư và nhà phát triển trên thế giới có thể sử dụng các nền tảng này và biến chatbot thành một thứ gì đó thông minh hơn một chút, bởi vì hầu hết những cái mà chúng tôi đã thấy cho đến nay đã xúc phạm chúng tôi bằng những lời nói vội vàng hoặc không có khả năng nói chính xác thời tiết.