Một mô hình học sâu tạo ra hành vi xã hội phi ngôn ngữ cho robot

Một mô hình học sâu tạo ra hành vi xã hội phi ngôn ngữ cho robot

  Một mô hình học sâu tạo ra hành vi xã hội phi ngôn ngữ cho robot

  Việc tạo ra hành vi xã hội của rô bốt liên quan đến việc chỉ định hành vi tiếp theo của rô bốt để đáp ứng hành vi của người dùng hiện tại trong khi vẫn duy trì tính liên tục với hành vi hiện tại của rô bốt.

  A deep learning model that generates nonverbal social behavior for robots


  Các nhà nghiên cứu tại Viện Nghiên cứu Điện tử và Viễn thông (ETRI) ở Hàn Quốc gần đây đã phát triển một mô hình dựa trên học sâu có thể giúp tạo ra các hành vi xã hội phi ngôn ngữ hấp dẫn, chẳng hạn như ôm hoặc bắt tay ai đó, trong robot. Mô hình của họ, được trình bày trong một bài báo xuất bản trước trên arXiv, có thể chủ động học các hành vi xã hội mới phù hợp với ngữ cảnh bằng cách quan sát các tương tác giữa con người với nhau.

  "Các kỹ thuật học sâu đã tạo ra những kết quả thú vị trong các lĩnh vực như thị giác máy tính và hiểu ngôn ngữ tự nhiên", Woo-Ri Ko, một trong những nhà nghiên cứu thực hiện nghiên cứu, nói với TechXplore. "Chúng tôi bắt đầu áp dụng học sâu vào người máy xã hội, cụ thể là bằng cách cho phép rô-bốt tự học hành vi xã hội từ các tương tác giữa con người với con người. Phương pháp của chúng tôi không yêu cầu kiến ​​thức trước về các mô hình hành vi của con người, phương pháp này thường tốn kém chi phí và thời gian để thực hiện ."

  Kiến trúc dựa trên mạng nơ ron nhân tạo (ANN) do Ko và các đồng nghiệp của ông phát triển kết hợp mô hình Seq2Seq (sequence-to-sequence) do các nhà nghiên cứu của Google giới thiệu vào năm 2014 với các mạng đối thủ chung (GAN). Kiến trúc mới đã được đào tạo trên bộ dữ liệu AIR-Act2Act, một tập hợp gồm 5.000 tương tác giữa người với người xảy ra trong 10 tình huống khác nhau.

  Ko giải thích: “Kiến trúc mạng thần kinh được đề xuất bao gồm một bộ mã hóa, bộ giải mã và bộ phân biệt. "Bộ mã hóa mã hóa hành vi người dùng hiện tại, bộ giải mã tạo ra hành vi tiếp theo của rô bốt theo hành vi của rô bốt và người dùng hiện tại, còn bộ phân biệt ngăn cản bộ giải mã xuất ra các chuỗi tư thế không hợp lệ khi tạo ra hành vi dài hạn."

  5.000 tương tác có trong tập dữ liệu AIR-Act2Act được sử dụng để trích xuất hơn 110.000 mẫu đào tạo (tức là các video ngắn), trong đó con người thực hiện các hành vi xã hội phi ngôn ngữ cụ thể trong khi tương tác với người khác. Các nhà nghiên cứu đã huấn luyện cụ thể mô hình của họ để tạo ra 5 hành vi phi ngôn ngữ cho rô-bốt, đó là cúi đầu, nhìn chằm chằm, bắt tay, ôm và che mặt của chính chúng.

  Ko và các đồng nghiệp của ông đã đánh giá mô hình tạo hành vi xã hội phi ngôn ngữ của họ trong một loạt mô phỏng, cụ thể là áp dụng mô hình đó cho phiên bản mô phỏng của Pepper, một rô-bốt hình người được sử dụng rộng rãi trong môi trường nghiên cứu. Những phát hiện ban đầu của họ rất hứa hẹn, vì mô hình của họ đã tạo thành công năm hành vi mà nó đã được huấn luyện vào những thời điểm thích hợp trong quá trình tương tác mô phỏng với con người.

  “Chúng tôi đã chỉ ra rằng có thể dạy cho robot các loại hành vi xã hội khác nhau bằng cách sử dụng phương pháp học sâu,” Ko nói. "Mô hình của chúng tôi cũng có thể tạo ra các hành vi tự nhiên hơn, thay vì lặp lại các hành vi được xác định trước theo cách tiếp cận dựa trên quy tắc hiện có. Với việc robot tạo ra các hành vi xã hội này, người dùng sẽ cảm thấy rằng hành vi của họ được thấu hiểu và quan tâm về mặt cảm xúc."

  Mô hình mới do nhóm các nhà nghiên cứu này tạo ra có thể giúp làm cho rô-bốt xã hội thích nghi hơn và đáp ứng xã hội hơn, từ đó có thể cải thiện chất lượng tổng thể và luồng tương tác của chúng với người dùng. Trong tương lai, nó có thể được triển khai và thử nghiệm trên nhiều loại hệ thống rô-bốt, bao gồm rô-bốt phục vụ tại nhà, rô-bốt dẫn đường, rô-bốt giao hàng, rô-bốt giáo dục và rô-bốt thuyết trình từ xa.

  "Bây giờ chúng tôi dự định tiến hành các thí nghiệm tiếp theo để kiểm tra khả năng của rô-bốt thể hiện các hành vi xã hội phù hợp khi được triển khai trong thế giới thực tế và đối mặt với con người; trình tạo hành vi được đề xuất sẽ được kiểm tra độ bền của nó đối với dữ liệu đầu vào ồn ào mà rô-bốt có thể thu được ", Ko nói thêm. "Hơn nữa, bằng cách thu thập và tìm hiểu thêm dữ liệu tương tác, chúng tôi dự định mở rộng số lượng các hành vi xã hội và hành động phức tạp mà rô-bốt có thể thể hiện."

  Zalo
  Hotline