From Chisato Horiuchi in Tokyo, Japan
Robot đối thoại quan tâm RIKEN đáp lại bằng kiến thức đã học
Liệu bạn có thể hành động một cách tự nguyện và quan tâm bằng cách đọc giọng nói của bạn và môi trường xung quanh hay không. Nó được coi là một trong những điểm mà robot phát triển nhanh chóng vẫn còn kém hơn con người. RIKEN đang tiến hành nghiên cứu để làm cho robot có được những khả năng này bằng cách sử dụng học sâu, đây là công nghệ cốt lõi của trí tuệ nhân tạo (AI). Chúng tôi sẽ đưa ra quyết định dựa trên thông tin trong quá khứ và hướng tới mục tiêu hiện thực hóa cuộc đối thoại gần gũi với mọi người. Robot có thể được quan tâm nhiều hơn vào năm 2050.
Robot "Butsukusa-kun" tương tác với người = RIKEN cung cấp
"Butsuka-kun, nhìn vào lối vào." Khi sinh viên gọi tên, robot trả lời: "Tôi không thể tránh được", và di chuyển đến lối vào phòng, giải thích tình hình xung quanh, nói "Tôi đã có một cốc" và "Tôi cảm thấy sáng sủa và thoải mái." Đây là một robot đối thoại được phát triển bởi Koichiro Yoshino, trưởng nhóm của Dự án RIKEN Robot Guardian.
"Butsukusa-kun" của RIKEN có các chức năng tương đương với mắt, tai và da người. Nó được trang bị một máy ảnh, micrô và các cảm biến nhận biết độ sáng và nhiệt độ, đồng thời thu thập thông tin bên ngoài bằng công nghệ gọi là "tích hợp đa phương thức" kết hợp những thông tin này. Đặc điểm là nó có thể nhận ra người và đồ vật trước mặt bạn và phản hồi.
Các ứng dụng như rô bốt gia đình truyền thống và trợ lý giọng nói trả lời câu hỏi theo các mẫu và quy tắc hiện có. Yoshino, trưởng nhóm cho biết, "Tôi chỉ đánh giá câu trả lời từ những gì mọi người nói, và tôi không thể xem xét tình hình xung quanh."
RIKEN đang tập trung vào việc sử dụng thông tin trong quá khứ làm cơ sở để đưa ra quyết định về các phản hồi. Mọi người đưa ra quyết định không chỉ dựa trên những gì họ nhìn thấy và nghe thấy tại chỗ, mà còn dựa trên những ký ức của quá khứ. Sau đó, hãy để robot xem xét các sự kiện trong quá khứ và kiến thức đã học. Ví dụ, khi được hỏi "Cái cốc ở đâu?", Hãy trả lời "Đáng lẽ nó phải ở trên bàn làm việc" hoặc "Tôi đã nhìn thấy nó trong nhà bếp" từ thông tin hình ảnh quá khứ tùy theo tình huống.
Mọi người thường có những câu hỏi và nhận xét không rõ ràng và chúng tôi cũng đang phát triển AI có thể đưa ra những câu trả lời phù hợp. Khi tôi biết được khoảng 30.000 nhận xét và phản hồi giả định thông tin du lịch như "Đây là nơi có tầm nhìn đẹp nhất" và "Tôi đói" theo từng cặp, tôi đã có thể trả lời phù hợp với độ chính xác khoảng 90%. Nếu AI được tích hợp vào robot, robot có thể thực hiện các hành động thông minh như đề xuất "hãy mang nước đi" khi cổ họng của một người bị khô.
Robot càng nói nhiều nội dung và tùy chọn hành động, thì càng có nhiều cảnh cho mọi người biết lý do tại sao họ lại thực hiện những hành động như vậy. Lời giải thích này giúp con người có thể hiểu được những gì robot đọc từ tình huống và giọng nói cũng như cách nó phản ứng.
Nhiệm vụ lâu dài là để robot tự nguyện quyết định hành động sẽ thực hiện. Nếu trong phòng của bạn có một chiếc điện thoại thông minh sắp rơi khỏi bàn và đôi tất bị văng ra sàn, bạn nên chọn cái nào trước? Nếu biết rằng mặt kính màn hình có thể bị vỡ nếu smartphone của bạn bị rơi, bạn có thể di chuyển đến nơi đặt bàn làm việc trước.
Rất khó để người máy hiện nay có được nhiều "lẽ thường" như vậy. Trưởng nhóm Yoshino dự đoán rằng "một robot giống như người hướng dẫn giải quyết các vấn đề một cách tự động sẽ hoạt động trong khoảng 50 năm."
■ Giải thích về phán đoán / hành động là đáng tin cậy
AI đã phát triển đáng kể trong những năm 10 với khả năng học sâu tự động trích xuất các đặc điểm của dữ liệu học tập. Sự phát triển của "AI có thể giải thích (XAI)" có thể đưa ra lý do cho sự phán đoán của AI là quan trọng không chỉ về mặt giao tiếp giữa robot và con người, mà còn về độ tin cậy của các hệ thống sử dụng AI.
Khi AI ngày càng trở nên tinh vi hơn, quá trình này trở thành một hộp đen, và có những vấn đề rất khó để giải thích cơ sở lý luận. Đặc biệt là trong các cơ sở y tế và các tổ chức tài chính, cần phải làm rõ cơ sở xét xử vì nó liên quan đến trách nhiệm giải trình. Phát triển AI có thể giải thích được là một nhiệm vụ cấp bách.
Điều này cũng đúng với robot. Trưởng nhóm RIKEN, Yoshino, nói rằng việc có được khả năng giải thích "dẫn đến việc một robot có thể nói chuyện và chung sống với con người mà không có bất kỳ sự khó chịu nào."
Cơ quan Dự án Nghiên cứu Tiên tiến Quốc phòng (DARPA) thuộc Bộ Quốc phòng Hoa Kỳ đang tiến hành nghiên cứu về khả năng nổ, với sự bổ sung của Đại học California và các trường khác. Tại Nhật Bản, NTT East và Hitachi đã bắt đầu một thử nghiệm trình diễn vào tháng 9 năm 2009 để tạo ra một mô hình dự đoán AI sử dụng XAI và dữ liệu xu hướng cũng như tối ưu hóa các hoạt động kinh doanh.
Khi các công nghệ mới lần lượt ra đời, vấn đề độ tin cậy là vô cùng quan trọng. Sự phát triển của công nghệ AI rất khó để nhìn thấy và hiểu được, nhưng điều cần thiết là phải nghĩ ra cách để thuyết phục tất cả mọi người.