Công nghệ giúp ô tô tự lái học hỏi từ ký ức của chính chúng

Công nghệ giúp ô tô tự lái học hỏi từ ký ức của chính chúng

    [Vui lòng đăng ký trang Youtube của Pacific Group tại

    https://www.youtube.com/channel/UCAxje1GxiUpZD6MEcR0f5Jg/videos

    Chúng tôi có các buổi chia sẻ về kinh doanh thực tế hàng tuần]

    Công nghệ giúp ô tô tự lái học hỏi từ ký ức của chính chúng
    bởi Tom Fleischman, Đại học Cornell

    self driving car
    Một chiếc xe tự hành có thể di chuyển trên đường thành phố và các môi trường ít bận rộn khác bằng cách nhận ra người đi bộ, các phương tiện khác và các chướng ngại vật tiềm ẩn thông qua trí thông minh có lợi. Điều này đạt được nhờ sự trợ giúp của mạng nơ-ron nhân tạo, được huấn luyện để "nhìn" môi trường xung quanh xe, bắt chước hệ thống nhận thức thị giác của con người.

    Nhưng không giống như con người, những chiếc ô tô sử dụng mạng nơ-ron nhân tạo không có ký ức về quá khứ và luôn trong tình trạng nhìn thấy thế giới lần đầu tiên — bất kể chúng đã lái bao nhiêu lần trên một con đường cụ thể trước đó. Điều này đặc biệt có vấn đề trong điều kiện thời tiết bất lợi, khi chiếc xe không thể dựa vào các cảm biến của nó một cách an toàn.

    Các nhà nghiên cứu tại Đại học Khoa học Máy tính và Thông tin Cornell Ann S.Bowers và Đại học Kỹ thuật đã đưa ra ba bài báo nghiên cứu đồng thời với mục tiêu khắc phục hạn chế này bằng cách cung cấp cho chiếc xe khả năng tạo ra "ký ức" về những trải nghiệm trước đây và sử dụng chúng. trong điều hướng trong tương lai.

    Nghiên cứu sinh Yurong You là tác giả chính của "HINDSIGHT is 20/20: Tận dụng các giao dịch trong quá khứ để hỗ trợ cảm nhận 3D", mà Bạn đã trình bày vào tháng 4 tại ICLR 2022, Hội nghị quốc tế về đại diện học tập. "Đại diện học tập" bao gồm học sâu, một loại học máy.

    "Câu hỏi cơ bản là, liệu chúng ta có thể học hỏi từ những lần lặp đi lặp lại không?" Tác giả cao cấp Kilian Weinberger, giáo sư khoa học máy tính tại Cornell Bowers CIS, cho biết. "Ví dụ: một chiếc ô tô có thể nhầm một cái cây có hình dạng kỳ lạ với người đi bộ trong lần đầu tiên máy quét laser của nó nhận biết nó từ xa, nhưng khi nó đủ gần, danh mục vật thể sẽ trở nên rõ ràng. Vì vậy, lần thứ hai bạn lái xe qua cùng một cái cây, ngay cả trong sương mù hoặc tuyết, bạn sẽ hy vọng rằng chiếc xe giờ đây đã học cách nhận ra nó một cách chính xác. "

    Đồng tác giả Katie Luo, một nghiên cứu sinh trong nhóm nghiên cứu, cho biết: “Trên thực tế, hiếm khi bạn lái xe theo một lộ trình lần đầu tiên. "Bản thân bạn hoặc người khác gần đây đã thúc đẩy nó, vì vậy việc thu thập trải nghiệm đó và sử dụng nó dường như là điều đương nhiên."

    Dẫn đầu bởi nghiên cứu sinh tiến sĩ Carlos Diaz-Ruiz, nhóm đã biên soạn bộ dữ liệu bằng cách lái một chiếc xe được trang bị cảm biến LiDAR (Phát hiện và đánh giá ánh sáng) liên tục dọc theo một vòng 15 km trong và xung quanh Ithaca, 40 lần trong khoảng thời gian 18 tháng. Các chuyến đi ghi lại các môi trường khác nhau (đường cao tốc, đô thị, khuôn viên trường), điều kiện thời tiết (nắng, mưa, tuyết) và thời gian trong ngày.

    Tập dữ liệu kết quả này — mà nhóm gọi là Ithaca365, và là chủ đề của một trong hai bài báo khác — có hơn 600.000 cảnh.

    Diaz-Ruiz, đồng tác giả của tờ Ithaca365, cho biết: “Nó cố tình phơi bày một trong những thách thức quan trọng đối với xe tự lái: điều kiện thời tiết xấu. "Nếu đường phố bị tuyết bao phủ, con người có thể dựa vào ký ức, nhưng nếu không có ký ức thì mạng lưới thần kinh sẽ bị thiệt thòi nặng nề."

    HINDSIGHT là một cách tiếp cận sử dụng mạng nơ-ron để tính toán các bộ mô tả của các đối tượng khi xe chạy qua chúng. Sau đó, nó nén các mô tả này, mà nhóm đã đặt tên cho các tính năng SQuaSH (Lịch sử thưa thớt về không gian-lượng tử) và lưu trữ chúng trên một bản đồ ảo, tương tự như một "bộ nhớ" được lưu trữ trong não người.

    Lần tới khi xe tự lái đi qua cùng một địa điểm, nó có thể truy vấn cơ sở dữ liệu SQuaSH cục bộ của mọi điểm LiDAR dọc theo tuyến đường và "ghi nhớ" những gì nó đã học lần trước. Cơ sở dữ liệu liên tục được cập nhật và chia sẻ trên các phương tiện, do đó làm phong phú thêm thông tin có sẵn để thực hiện nhận dạng.

    "Thông tin này có thể được thêm vào dưới dạng các tính năng cho bất kỳ máy dò vật thể 3D nào dựa trên LiDAR;" Bạn đã nói. "Cả máy dò và biểu diễn SQuaSH đều có thể được đào tạo chung mà không cần bất kỳ sự giám sát bổ sung nào hoặc chú thích của con người, việc này tốn nhiều thời gian và công sức."

    Trong khi HINDSIGHT vẫn giả định rằng mạng nơ-ron nhân tạo đã được đào tạo để phát hiện đối tượng và tăng cường khả năng tạo ký ức cho nó, MODEST (Phát hiện đối tượng di động với tính phù du và tự đào tạo) - chủ đề của ấn phẩm thứ ba - còn đi xa hơn.

    Ở đây, các tác giả đã cho chiếc xe học toàn bộ đường dẫn nhận thức từ đầu. Ban đầu, mạng nơ-ron nhân tạo trên xe chưa bao giờ được tiếp xúc với bất kỳ vật thể hay đường phố nào. Thông qua nhiều chuyến đi trên cùng một tuyến đường, nó có thể biết được phần nào của môi trường là đứng yên và phần nào là vật thể chuyển động. Từ từ nó tự dạy cho mình những gì cấu thành nên những người tham gia giao thông khác và những gì là an toàn để bỏ qua.

    Sau đó, thuật toán có thể phát hiện những đối tượng này một cách đáng tin cậy — ngay cả trên những con đường không phải là một phần của đường đi qua lặp lại ban đầu.

    Các nhà nghiên cứu hy vọng rằng cả hai cách tiếp cận có thể giảm đáng kể chi phí phát triển của các phương tiện tự hành (hiện vẫn phụ thuộc nhiều vào dữ liệu chú thích của con người tốn kém) và làm cho những phương tiện như vậy hiệu quả hơn bằng cách học cách điều hướng đã ăn những địa điểm mà chúng được sử dụng nhiều nhất.

    Cả Ithaca365 và MODEST sẽ được giới thiệu tại Kỷ yếu Hội nghị IEEE về Nhận dạng Mẫu và Thị giác Máy tính (CVPR 2022), được tổ chức từ ngày 19 đến 24 tháng 6 tại New Orleans.

    Những người đóng góp khác bao gồm Mark Campbell, Giáo sư John A. Mellowes '60 về Kỹ thuật Cơ khí tại Trường Cơ khí và Hàng không Vũ trụ Sibley, trợ lý giáo sư Bharath Hariharan và Wen Sun, từ khoa học máy tính tại Bowers CIS; cựu nhà nghiên cứu sau tiến sĩ Wei-Lun Chao, hiện là trợ lý giáo sư về khoa học máy tính và kỹ thuật tại Bang Ohio; và các sinh viên tiến sĩ Cheng Perng Phoo, Xiangyu Chen và Junan Chen.

    Zalo
    Hotline