Các nhà nghiên cứu cho biết trong một nghiên cứu mới đây, một phương pháp ghi nhãn và truy xuất mới để lưu trữ dữ liệu ở dạng DNA có thể làm cho phương pháp này trở thành một giải pháp hữu dụng cho lượng dữ liệu ngày càng tăng của nhân loại. Ảnh: Caroline Davis2010 / Flickr
Các nhà khoa học Viện Công nghệ Massachusetts đã phát triển một kỹ thuật mới để ghi nhãn và truy xuất các tệp dữ liệu DNA – một bước đột phá có thể giúp thu nhỏ lượng khí thải carbon trong thế giới kỹ thuật số đang mở rộng nhanh chóng.
Trong một nghiên cứu được công bố mới đây trên tạp chí Nature Materials, các nhà khoa học đã chứng minh việc truy xuất chính xác các tệp hình ảnh đơn lẻ được lưu trữ dưới dạng chuỗi DNA từ bộ 20 bức ảnh.
Mỗi ngày, hàng tỷ email đan xen trên các siêu xa lộ thông tin và hàng trăm triệu bức ảnh và tài liệu được tải lên hệ thống lưu trữ đám mây. Tất cả dữ liệu đó không chỉ trôi nổi trong không gian mạng, chờ được truy xuất, đồng thời, các tệp kỹ thuật số và dữ liệu bên trong phải được lưu trữ vật lý.
Không có gì ngạc nhiên khi nhu cầu lưu trữ dữ liệu đang tăng lên theo cấp số nhân. Để tiết kiệm không gian và năng lượng, các nhà khoa học đã và đang tìm kiếm các giải pháp lưu trữ dữ liệu hiệu quả hơn. DNA là một trong những giải pháp như vậy.
Các phân tử DNA đã phát triển khả năng đóng gói thông tin di truyền với mật độ cực cao – một khả năng có thể bị tấn công để lưu trữ dữ liệu kỹ thuật số.
Đồng tác giả nghiên cứu Mark Bathe, giáo sư kỹ thuật sinh học của MIT, nói: “DNA dày gấp hàng nghìn lần thậm chí so với bộ nhớ flash, và một đặc tính thú vị khác là một khi bạn tạo ra polyme DNA, nó không tiêu tốn năng lượng. “Bạn có thể viết DNA và sau đó lưu trữ nó mãi mãi.”
Dữ liệu kỹ thuật số giao dịch ở dạng mã nhị phân, đó là 0s và 1s. DNA có thể tái tạo hệ thống này bằng cách sử dụng bốn nucleotide của nó, A, T, G và C – với G và C đại diện cho 0, ví dụ, và A và T phụ cho 1.
Nhiều nhóm các nhà khoa học và kỹ sư trước đây đã sử dụng DNA để lưu trữ thông tin, mã hóa các bài hát, phim và ảnh dưới dạng chuỗi xoắn kép. Họ nói rằng việc lưu trữ dữ liệu DNA có rất tiện dụng, ổn định, an toàn và hiệu quả.
Tuy nhiên, công nghệ này cũng có mặt hạn chế: Thứ nhất, việc tổng hợp tất cả mã DNA rất tốn kém. Thứ hai, các nhà khoa học vẫn chưa tìm ra cách tốt nhất để sắp xếp thông qua mã DNA khi các tệp cần được lấy ra khỏi cơ sở dữ liệu lớn.
Để giải quyết vấn đề thứ hai, Bathe và các đối tác nghiên cứu của ông tại MIT đã phát triển một kỹ thuật truy xuất dữ liệu DNA mới. Thay vì gấp một loạt các chuỗi DNA lại với nhau, các nhà nghiên cứu đã gói gọn các tệp dữ liệu DNA trong các hạt silica nhỏ, mỗi hạt có chiều rộng 6 micromet. Để sắp xếp các tệp DNA, sau đó gắn nhãn mỗi hạt bằng một chuỗi DNA có gắn nội dung giới thiệu của nó.
Ngoài mã vạch DNA, bằng cách sử dụng các hạt từ tính hoặc huỳnh quang, các nhà nghiên cứu có thể thêm dữ liệu tương ứng cho các tệp bằng các màu sắc, hình ảnh.
Sự kết hợp này cho phép các nhà khoa học sử dụng logic Boolean – các tổ hợp cụm từ tìm kiếm như “tổng thống VÀ thế kỷ 18” – để cải thiện kết quả tìm kiếm của họ khi truy xuất dữ liệu.
Tác giả chính James Banal, một postdoc cấp cao của MIT, cho biết: “Ở trạng thái hiện tại của nghiên cứu, chúng tôi đang tìm kiếm ở tốc độ 1 kilobyte mỗi giây”.
“Tỷ lệ tìm kiếm tệp hệ thống của chúng tôi được xác định bởi kích thước dữ liệu trong mỗi tệp, tuy nhiên đang bị giới hạn bởi chi phí quá cao cho một dữ liệu DNA có dung lượng 100 megabyte, và số lượng bộ phân loại mà chúng tôi có thể sử dụng song song. Nếu quá trình tổng hợp DNA đủ rẻ, chúng tôi sẽ có thể tối đa hóa kích thước dữ liệu có thể lưu trữ trên mỗi tệp”, Banal nói.
Hệ thống lưu trữ và truy xuất dữ liệu mới sẽ không lý tưởng cho tất cả các loại lưu trữ. Thêm vào đó, có những công nghệ lưu trữ dữ liệu đầy hứa hẹn khác đang được triển khai, bao gồm cả các trung tâm dữ liệu lượng tử. Nhưng công nghệ mới có thể tỏ ra hữu ích cho việc “đóng băng” các dữ liệu không cần truy cập thường xuyên để lưu trữ một cách hiệu quả.
“Mặc dù có thể phải mất một thời gian nữa DNA mới có thể trở thành phương tiện lưu trữ dữ liệu, nhưng ngày nay đã tồn tại một nhu cầu cấp thiết về các giải pháp lưu trữ khổng lồ, chi phí thấp cho các mẫu DNA và RNA có sẵn từ thử nghiệm COVID-19, giải trình tự bộ gen người và các lĩnh vực khác của bộ gen”, Bathe nói.
Theo: https://www.upi.com/Science_News/2021/06/10/dna-data-storage-file-retrieval/6291623351030/