Các nhà nghiên cứu tạo ra bộ dữ liệu mở khổng lồ để nâng cao các giải pháp AI trong việc thu giữ carbon
của Catherine Barzler, Viện Công nghệ Georgia
Vật liệu, chất hấp phụ, nhiệm vụ và ứng dụng tiềm năng của bộ dữ liệu ODAC23. Hình ảnh được lấy mẫu ngẫu nhiên từ tập dữ liệu. Nhà cung cấp: ACS Central Science (2024). DOI: 10.1021/acscentsci.3c01629
Để tránh những tác động thảm khốc của khí hậu, cần phải giải quyết lượng khí thải carbon quá mức. Tại thời điểm này, cắt giảm khí thải là không đủ. Thu giữ không khí trực tiếp, một công nghệ hút carbon dioxide ra khỏi không khí xung quanh, có tiềm năng lớn giúp giải quyết vấn đề.
Nhưng có một thách thức lớn. Đối với công nghệ thu khí trực tiếp, mọi loại môi trường và vị trí đều yêu cầu một thiết kế cụ thể duy nhất. Ví dụ, cấu hình thu giữ trực tiếp trên không ở Texas nhất thiết phải khác với cấu hình ở Iceland. Các hệ thống này phải được thiết kế với các thông số chính xác về độ ẩm, nhiệt độ và luồng không khí cho từng nơi.
Giờ đây, Georgia Tech và Meta đã hợp tác để tạo ra một cơ sở dữ liệu khổng lồ, có khả năng giúp việc thiết kế và triển khai các công nghệ thu khí trực tiếp trở nên dễ dàng và nhanh chóng hơn. Cơ sở dữ liệu nguồn mở cho phép nhóm đào tạo một mô hình AI nhanh hơn nhiều so với các mô phỏng hóa học hiện có. Dự án có tên là OpenDAC có thể đẩy nhanh các giải pháp về khí hậu mà hành tinh này rất cần.
Nghiên cứu của nhóm đã được xuất bản trên ACS Central Science.
Andrew J. Medford, phó giáo sư tại Trường Kỹ thuật Hóa học và Sinh học phân tử (ChBE) và một nhà nghiên cứu cho biết: “Để thu được không khí trực tiếp, có rất nhiều ý tưởng về cách tận dụng tốt nhất các luồng không khí và sự dao động nhiệt độ của một môi trường nhất định”. tác giả chính của bài báo.
“Nhưng vấn đề lớn là tìm ra loại vật liệu có thể thu giữ carbon hiệu quả trong điều kiện cụ thể của từng môi trường”.
Medford cho biết ý tưởng của họ là “tạo ra một cơ sở dữ liệu và một bộ công cụ để giúp các kỹ sư nói chung, những người cần tìm đúng loại vật liệu có thể hoạt động được”. “Chúng tôi muốn sử dụng máy tính để đưa họ từ việc không biết bắt đầu từ đâu đến việc cung cấp cho họ một danh sách vật liệu phong phú để tổng hợp và thử nghiệm.”
Chứa dữ liệu phản ứng của 8.400 vật liệu khác nhau và được hỗ trợ bởi gần 40 triệu phép tính cơ học lượng tử, nhóm nghiên cứu tin rằng đây là bộ dữ liệu lớn nhất và mạnh mẽ nhất thuộc loại này.
Xây dựng quan hệ đối tác (và cơ sở dữ liệu)
Các nhà nghiên cứu thuộc nhóm Nghiên cứu AI Cơ bản (FAIR) của Meta đang tìm cách khai thác năng lực học máy của họ để giải quyết vấn đề biến đổi khí hậu. Họ đã nghiên cứu phương pháp thu giữ khí trực tiếp như một công nghệ đầy hứa hẹn và cần tìm một đối tác có kiến thức chuyên môn về hóa học vật liệu vì lĩnh vực này liên quan đến việc thu hồi carbon. Họ đi thẳng đến Georgia Tech.
David Sholl, giáo sư ChBE, Cecile L. và David I.J. Nghiên cứu sinh Wang, đồng thời là giám đốc Sáng kiến khử cacbon chuyển đổi của Phòng thí nghiệm quốc gia Oak Ridge, là một trong những chuyên gia hàng đầu thế giới về khung kim loại-hữu cơ (MOF). Đây là loại vật liệu có triển vọng thu giữ không khí trực tiếp nhờ cấu trúc dạng lồng và khả năng thu hút và bẫy carbon dioxide đã được chứng minh.
Sholl đã đưa Medford, người chuyên áp dụng các mô hình học máy vào các mô phỏng cơ học nguyên tử và lượng tử vì chúng liên quan đến hóa học, vào dự án.
Sholl, Medford và các sinh viên của họ đã cung cấp tất cả thông tin đầu vào cho cơ sở dữ liệu. Bởi vì cơ sở dữ liệu dự đoán các tương tác MOF và sản lượng năng lượng của các tương tác đó nên cần có lượng thông tin đáng kể.
Họ cần biết cấu trúc của hầu hết mọi MOF đã biết - cả cấu trúc MOF và cấu trúc của MOF tương tác với các phân tử carbon dioxide và nước.
Medford cho biết: “Để dự đoán những gì một vật liệu có thể làm, bạn cần biết từng nguyên tử đơn lẻ ở đâu và nguyên tố hóa học của nó là gì”. "Tìm ra đầu vào cho cơ sở dữ liệu là một nửa vấn đề và đó là lúc nhóm Georgia Tech của chúng tôi mang đến kiến thức chuyên môn cốt lõi."
Nhóm đã tận dụng các bộ sưu tập lớn cấu trúc MOF mà Sholl và các cộng tác viên của ông đã phát triển trước đó. Họ cũng tạo ra một bộ sưu tập lớn các cấu trúc bao gồm những điểm không hoàn hảo được tìm thấy trong các vật liệu thực tế.
Sức mạnh của học máy
Anuroop Sriram, trưởng nhóm kỹ thuật nghiên cứu tại FAIR và là tác giả đầu tiên của bài báo, đã tạo ra cơ sở dữ liệu bằng cách chạy các tính toán hóa học lượng tử trên các đầu vào do nhóm Georgia Tech cung cấp. Những phép tính này sử dụng khoảng 400 triệu giờ CPU, gấp hàng trăm lần mức tính toán mà một phòng thí nghiệm điện toán học thuật trung bình có thể thực hiện trong một năm.
FAIR cũng đã đào tạo các mô hình học máy trên cơ sở dữ liệu. Sau khi được đào tạo về 40 triệu phép tính, các mô hình học máy có thể dự đoán chính xác cách hàng nghìn MOF sẽ tương tác với carbon dioxide.
Nhóm đã chứng minh rằng các mô hình AI của họ là công cụ mới mạnh mẽ để khám phá vật liệu, mang lại độ chính xác tương đương với các phép tính hóa học lượng tử truyền thống trong khi nhanh hơn nhiều. Những tính năng này sẽ cho phép các nhà nghiên cứu khác mở rộng
làm việc để khám phá nhiều MOF khác trong tương lai.
Sriram cho biết: “Mục tiêu của chúng tôi là xem xét tập hợp tất cả các MOF đã biết và tìm ra những MOF thu hút carbon dioxide mạnh nhất trong khi không thu hút các thành phần không khí khác như hơi nước và sử dụng các tính toán lượng tử có độ chính xác cao này để làm điều đó”. “Theo hiểu biết của chúng tôi, đây là điều mà không cơ sở dữ liệu thu giữ carbon nào khác có thể làm được.”
Đưa cơ sở dữ liệu của riêng mình vào sử dụng, nhóm Georgia Tech và Meta đã xác định được khoảng 241 MOF có tiềm năng đặc biệt cao để thu giữ trực tiếp trên không.
Tiến về phía trước với tác động
Matt Uyttendaele, giám đốc nhóm hóa học FAIR của Meta và là đồng tác giả của bài báo, cho biết: “Theo Liên hợp quốc và hầu hết các nước công nghiệp phát triển, chúng ta cần đạt được mức phát thải carbon dioxide bằng 0 vào năm 2050”.
"Hầu hết điều đó phải xảy ra bằng cách ngừng hoàn toàn lượng khí thải carbon, nhưng chúng ta cũng phải giải quyết lượng khí thải carbon trước đây và các lĩnh vực rất khó khử cacbon của nền kinh tế—chẳng hạn như hàng không và công nghiệp nặng. Đó là lý do tại sao các công nghệ loại bỏ CO2 như thu giữ không khí trực tiếp phải ra đời trực tuyến trong 25 năm tới."
Mặc dù thu khí trực tiếp vẫn còn là một lĩnh vực non trẻ, nhưng các nhà nghiên cứu cho biết điều quan trọng là các công cụ đột phá—như cơ sở dữ liệu OpenDAC có sẵn trong bài báo của nhóm—hiện đang được phát triển.
Sriram nói: “Sẽ không có một giải pháp nào có thể đưa chúng ta đạt mức phát thải ròng bằng 0”. "Việc thu khí trực tiếp có tiềm năng rất lớn nhưng cần phải tăng quy mô đáng kể trước khi chúng tôi có thể tạo ra tác động thực sự. Tôi nghĩ cách duy nhất chúng tôi có thể đạt được điều đó là tìm kiếm những vật liệu tốt hơn."
Các nhà nghiên cứu của cả hai nhóm hy vọng cộng đồng khoa học sẽ cùng chung tay tìm kiếm vật liệu phù hợp. Toàn bộ dự án tập dữ liệu OpenDAC là nguồn mở, từ dữ liệu, mô hình đến thuật toán.
Medford nói: “Tôi hy vọng điều này sẽ đẩy nhanh sự phát triển của các công nghệ phát thải âm như thu hồi không khí trực tiếp mà có thể không thể thực hiện được bằng các cách khác”. "Là một loài, chúng ta phải giải quyết vấn đề này vào một lúc nào đó. Tôi hy vọng công việc này có thể góp phần đưa chúng ta đến đó và tôi nghĩ nó thực sự có tác dụng làm được điều đó."