Một mô hình tổng quát nguồn mở để thao tác đối tượng robot

Một mô hình tổng quát nguồn mở để thao tác đối tượng robot

    Việc phát hành công khai ChatGPT và các mô hình ngôn ngữ lớn (LLM) khác đã cho phép các nhà phát triển trên toàn thế giới bắt đầu thử nghiệm các mô hình này để nâng cao khả năng tương tác của hệ thống của riêng họ. Tuy nhiên, các mô hình tổng quát tương tự cho thao tác robot vẫn còn khan hiếm.

    Một mô hình tổng quát nguồn mở để thao tác đối tượng robot

    Đây là những robot mà chúng tôi đã thử nghiệm Octo – bạn có thể thấy rằng có rất nhiều loại cánh tay robot khác nhau, từ nhỏ đến lớn, một cánh tay cho đến hai cánh tay. Octo đã có thể điều khiển tất cả những robot này. Tín dụng: Nhóm và cộng sự.

    Các nhà nghiên cứu tại Đại học California, Berkeley (UC Berkeley), Đại học Stanford và CMU gần đây đã giới thiệu Octo, một mô hình tổng quát nguồn mở để thao tác bằng robot có thể cho phép các hệ thống robot khác nhau thao tác hiệu quả với nhiều loại vật thể. Mô hình này, được trình bày trong một bài báo được xuất bản trước trên máy chủ  arXiv , có thể mở ra những con đường mới cho sự phát triển của robot có thể giải quyết các công việc thủ công.

    Dibya Ghosh, Homer Walke, Karl Pertsch, Kevin Black và Oier Mees, nói với Tech Xplore: “Phần lớn tiến bộ hiện tại trong AI được thúc đẩy bởi các bộ dữ liệu lớn và mô hình lớn”. "Trong cộng đồng người máy, gần đây chúng tôi đã tập hợp bộ dữ liệu Open X-Embodiment, một bộ dữ liệu thao tác lớn tập hợp dữ liệu từ nhiều tổ chức nghiên cứu. Mặc dù bộ dữ liệu mới này là một nguồn tài nguyên thực sự thú vị nhưng vào thời điểm đó không có nhiều mô hình có thể tạo ra vẫn chưa sử dụng được nó."

    Công việc gần đây của nhóm nghiên cứu này có hai mục tiêu chính. Đầu tiên là phát triển một mô hình robot tổng quát tốt có thể áp dụng cho nhiều robot khác nhau và thứ hai là tạo mã nguồn mở cho phép các nhà nghiên cứu khác xây dựng các mô hình tương tự trong tương lai.

    "Octo là cái mà chúng tôi gọi là mô hình robot 'tổng quát', một mạng lưới thần kinh có thể điều khiển nhiều loại robot khác nhau và khiến chúng thực hiện các yêu cầu như 'nhấc thìa', 'đóng ngăn kéo', 'lau bàn', v.v. ,” Ghosh, Walke, Pertsch, Black và Mees giải thích.

    "Trở thành một nhà tổng quát và làm việc trên nhiều robot là điều quan trọng, bởi vì nếu bạn nhìn vào các phòng thí nghiệm nghiên cứu trên khắp thế giới, nhiều người trong số họ sử dụng các robot khác nhau, vì vậy cách duy nhất để đảm bảo Octo có thể được nhiều nhà nghiên cứu sử dụng là hỗ trợ nhiều loại robot."

    Trong cộng đồng nghiên cứu và phát triển công nghệ, các công cụ tính toán hiệu suất cao có thể áp dụng trên nhiều hệ thống thường được gọi là mô hình nền tảng. Một ví dụ về các mô hình này là ChatGPT, có thể được sử dụng để trang bị cho các tác nhân và hệ thống khác nhau khả năng xử lý ngôn ngữ tự nhiên (NLP).

    Ghosh, Walke, Pertsch, Black và Mees cho biết: “Chúng tôi muốn xây dựng các mô hình nền tảng tương tự, nhưng để điều khiển robot, hay nói cách khác là các mô hình có thể điều khiển nhiều robot và khiến chúng giải quyết được nhiều nhiệm vụ khác nhau”.

    "Octo là bước đầu tiên hướng tới mục tiêu đó. Quá trình đào tạo của nó trông rất giống với các mô hình như ChatGPT: chúng tôi tuyển chọn một tập dữ liệu lớn và đa dạng, trong trường hợp của chúng tôi là dữ liệu rô-bốt thay vì văn bản và huấn luyện một mô hình lớn để dự đoán hành động tiếp theo mà rô-bốt nên làm thực thi dựa trên trạng thái robot hiện tại và hướng dẫn nhiệm vụ."

    Octo, mô hình được phát triển bởi Ghosh, Walke, Pertsch, Black và Mees dựa trên cùng loại mạng thần kinh như ChatGPT, được gọi là máy biến áp. Ưu điểm chính của Octo so với các mô hình robot được phát triển trước đây là quy mô dữ liệu được sử dụng để huấn luyện nó và tính linh hoạt của nó.

    Mô hình này được đào tạo trên tập dữ liệu lớn nhất về quỹ đạo thao tác robot được biên soạn cho đến nay; tập dữ liệu Open X-Embodiment. Octo cũng có thể xử lý nhiều loại đầu vào cảm giác khác nhau bao gồm các loại hình ảnh khác nhau, bài đọc chung của robot, hướng dẫn ngôn ngữ, hình ảnh liên quan đến mục tiêu, v.v.

    Mời đối tác xem hoạt động của Công ty TNHH Pacific Group.
    FanPage:  https://www.facebook.com/Pacific-Group
    YouTube:  https://www.youtube.com/@PacificGroupCoLt 

    Zalo
    Hotline