Lưu trữ phi tập trung là gì?
Các files, data của người dùng sẽ được phân nhỏ thành các shard và đồng thời sẽ được lưu ở nhiều nodes trong mạng lưới phi tập trung. Giống với việc lưu trữ thông thường, khi người dùng cần file thì có thể đưa ra yêu cầu để nhận lại file và sẽ tải xuống từng mảnh dữ liệu từ các validators trong mạng lưới cho đến khi nhận được tất cả và thành file hoàn chỉnh.
Công nghệ chuỗi khối Blockchain ra đời hoạt động như một quyển sổ cái phân tán nơi các giao dịch sẽ được ghi nhận trực tiếp trên sổ và được lưu vào các chuỗi chính. Số lượng giao dịch gia tăng theo thời gian nên buộc phần lưu trữ phải nâng cao hơn. Có thể tham khảo thêm –> tại đây!
Ưu điểm của lưu trữ phi tập trung
Lưu trữ phi tập trung ra đời như một giải pháp để giải quyết các vấn đề tồn đọng trước đó của hệ thống lưu trữ tập trung, đồng thời mang tới nhiều lợi ích hơn.
4 ưu điểm lớn nhất khi sử dụng hệ thống lưu trữ phi tập trung sẽ được giải thích ngay sau đây.
Tính bảo mật
Chúng ta đã sớm biết rằng blockchain sử dụng một hình thức bảo mật riêng biệt so với các dịch vụ máy chủ. Mỗi người có thể tạo riêng hồ sơ cá nhân trên Blockchain mà không cần bất kỳ sự hỗ trợ nào từ bên trung gian, điều này giúp bộ hồ sơ đó hoàn toàn tách biệt khỏi danh tính thực của người sử dụng.
Bởi vậy, chức năng account management được thực hiện ẩn danh và danh tính của người dùng được ẩn đi, vì thế mà mức độ bảo mật cao hơn. Không như các hệ thống truyền thống – người sử dụng nên đăng ký bằng thông tin cá nhân (như họ và tên, thông tin tài khoản ngân hàng) lên mạng lưới, danh tính thật của người dùng sẽ không bị tiết lộ trên nền tảng Blockchain trừ khi người dùng muốn.
Một trong số những công nghệ quan trọng nhất trong việc giải quyết các vấn đề bảo mật trên hệ thống lưu trữ đám mây là mã hóa dựa trên thuộc tính (ABE), cho phép private key generator kết nối với tất cả các dữ liệu. Hệ thống của blockchain có thể giải quyết vấn đề tương tự khi cung cấp cho người sử dụng khả năng thiết lập và phân bổ private keys.
An ninh mạng
Tất cả mọi dữ liệu phải được mã hóa trước khi giao dịch trên Blockchain. Có nghĩa là chỉ duy nhất người có quyền sử dụng khóa giải mã (decryption key) mới có thể truy cập các nội dung của một file.
Mặc dù một vài mạng lưới lưu trữ dữ liệu tập trung cũng cung cấp tính năng mã hóa, nhưng kể từ khi các files trên mạng phi tập trung blockchain được chia thành những mục nhỏ hơn, và những phần đấy được phân bổ tới các bên cung cấp dịch vụ lưu trữ khác nhau nên sẽ không giống như các mô hình điện toán đám mây, ngay cả node độc cũng không thể giải mã toàn bộ file và truy cập vào dữ liệu.
→ Không một cá nhân, một tổ chức hay các bên liên quan có thể xử lý dữ liệu đang tồn tại trên hệ thống. Hơn nữa, vì mỗi phần thông tin được lưu trữ ở ít nhất ba nơi, nên những dữ liệu này sẽ luôn luôn tiếp cận được kể cả khi một vài nodes không khả dụng hoặc gặp lỗi phần cứng.
Trong trường hợp thiếu mất một vài phần thông tin, toàn bộ file vẫn có thể được khôi phục nhờ sự hỗ trợ của cơ chế Erasure Coding.
Bên cạnh đó, các nhà cung cấp dịch vụ lưu trữ cũng được yêu cầu chứng minh rằng dữ liệu không bị điều khiển bởi một ai đứng sau. Ngay cả trong trường hợp có sự thao túng, danh mục thông tin vẫn có thể được kết nối một cách dễ dàng thông qua sự hỗ trợ từ Merkle Root của file.
Còn mô hình lưu trữ dữ liệu tập trung không cam kết với khách hàng về sự toàn vẹn của dữ liệu và họ cũng không minh bạch quá trình xử lý thông tin với người sở hữu dữ liệu.
Băng thông và chi phí
Với mô hình lưu trữ đám mây, khi người dùng cần download một file, toàn bộ file đó sẽ được tải xuống từ một trong số những máy chủ của bên cung cấp dịch vụ lưu trữ. Mặc dù một vài các nhà cung cấp xác nhận rằng quá trình download sẽ được thực hiện từ máy chủ khả dụng nhất vào thời điểm đó, nhưng quá trình ấy vẫn phải được hoàn thành thông qua một kết nối duy nhất.
Trong trường hợp có yêu cầu tải file xuống từ các hệ thống blockchain, file phải được truy xuất từ mạng lưới, nghĩa là mỗi mục thông tin cần phải được download từ một nhà cung cấp dịch vụ lưu trữ riêng biệt.
→ Quá trình download sẽ được duy trì ở trạng thái song song, giúp tối đa hóa tính khả dụng của băng thông và giảm thời gian download về mức tối thiểu.
Trong hệ thống lưu trữ dữ liệu truyền thống, một khoản phí cụ thể sẽ được yêu cầu trả trước cho một gói sử dụng (ví dụ $5/tháng cho 5T dung lượng lưu trữ) và khách hàng thường mua nhiều hơn số dung lượng trống mà họ thực sự cần.
Thế nhưng đến với mô hình lưu trữ dữ liệu phi tập trung, chi phí có thể được tính toán dựa trên nhu cầu sử dụng của từng cá nhân, thay vì phải sử dụng gói trả trước thì người sử dụng chỉ cần trả phí cho mỗi lần sử dụng.
Hơn nữa, hệ thống lưu trữ dữ liệu trên các nền tảng blockchain tương lai sẽ có chi phí thấp hơn mô hình lưu trữ truyền thống và cũng cho phép người dùng chọn các loại ổ cứng yêu thích giữa những tính năng có sẵn cũng như thời hạn sử dụng của các thiết bị này. Theo (http://techgenix.com/bloc, 2019), bộ lưu trữ dữ liệu của blockchain có giá khoảng 2$/terabyte/tháng, tiết kiệm chi phí hơn so với Amazon với 3$/tháng.
Reputation System
Hệ thống lưu trữ phi tập trung sử dụng cơ chế Reputation System. Reputation là một cơ chế dùng để làm thước đo niềm tin của cộng đồng đối với một node, dựa trên những giao dịch và tương tác trước đó của họ.
Danh tiếng của node càng lớn, độ tin cậy của node đó trên mạng lưới càng tăng. Vì đa phần các giao dịch trên hệ thống đều được thực hiện bởi các bên riêng biệt, chưa hiểu biết rõ về nhau, nên quan trọng là người dùng phải xác định được liệu có nên tương tác với một node cụ thể trong các phiên giao dịch sắp tới không.
Đặc điểm này cho phép mạng lưới tự động xác minh tính trung thực của virtual host, đảm bảo rằng các hosts sẽ đáp ứng tiêu chuẩn mà họ đã đề ra, nếu không, các hosts này sẽ bị gỡ khỏi mạng lưới.
Điểm tuyệt nhất của Reputation System chính là cho phép khách hàng đánh giá trải nghiệm của mình đối với các nhà cung cấp dịch vụ, điều này khuyến khích tính trung thực của các nhà cung cấp dịch vụ lưu trữ phi tập trung.
Khó khăn của ngành lưu trữ phi tập trung
Rõ ràng, decentralized storage vẫn còn rất non trẻ và đang phải vật lộn với nhiều khó khăn, thử thách. Và lưu trữ phi tập trung vẫn chưa có nhiều bước tiến ngoại mục. Ở phần này, vấn đề chung mà các cá nhân và tổ chức thường gặp phải ở mô hình lưu trữ dữ liệu của blockchain sẽ được làm rõ.
An ninh mạng
Mặc dù chúng ta đã đề cập từ trước rằng bảo mật là một trong số đặc điểm nổi trội của blockchain nhưng hệ thống của blockchain không thể an toàn 100%.
Do nhu cầu chỉnh sửa dữ liệu hay chia sẻ cho các bên thứ ba, trong khi các files phải được mã hóa và giải mã khiến cho nguy cơ xảy ra các vấn đề bảo mật tăng lên. Dữ liệu chỉ an toàn khi chúng được lưu trữ, còn trong quá trình thao tác, chuyển giao trên hệ thống vẫn sẽ tồn tại rủi ro về bảo mật.
Ngoài ra, có một số các vụ tấn công có thể đe dọa blockchain, và hậu quả là làm ảnh hưởng đến các ứng dụng đang vận hành trên toàn mạng. Tấn công 51% là hình thức phổ biến nhất, có thể xảy ra trong các hệ thống blockchain sử dụng thuật toán Proof of Work (PoW). Để ngăn chặn cuộc tấn công 51%, một mạng lưới blockchain cần phải chứa một số lượng nodes đủ lớn để không một nhóm người nào có thể lợi dụng và thao túng.
Thiếu dữ liệu để đưa ra quyết định
Hiện nay, nhiều công ty và tổ chức cho rằng những dữ liệu mà họ thu thập được chính là nguồn căn cứ quan trọng để phân tích và giúp họ đưa ra những quyết định tốt hơn.
Quá trình này không thể thực hiện được trên hệ thống lưu trữ thông tin của blockchain vì tất cả các dữ liệu đều được mã hóa trước khi chúng được lưu trữ trong các bên cung cấp dịch vụ lưu trữ dữ liệu.
Tuy nhiên, công ty có thể xây dựng một hệ thống lưu trữ trên nền tảng blockchain của riêng họ, ví dụ như mô hình của BlockHouse, cấp quyền cho phép cũng như chìa khóa cho những người đại diện chuyên gia của họ. Người đại diện có thể trích xuất tất cả các số liệu từ mạng lưới và phân tích chúng theo yêu cầu của công ty. Đối với trường hợp này, hệ thống lưu trữ blockchain sẽ được sử dụng với mục đích một giải pháp chống giả mạo và có thể theo dõi dữ liệu.
Thiếu ràng buộc pháp lý
Khi sử dụng dịch vụ lưu trữ phi tập trung sẽ không có hợp đồng trên giấy tờ giữa nhà cung cấp và người sử dụng. Mọi thứ đều được xử lý bằng smart contracts trên blockchain.
Trong trường hợp lừa đảo, chiếm đoạt tài sản hoặc bất kỳ những vấn đề xảy ra sẽ không có việc truy cứu trách nhiệm hình sự hay tòa án đứng ra bảo hộ. Vì vậy đây cũng là một trở ngại cho các doanh nghiệp khi cân nhắc sử dụng dịch vụ lưu trữ phi tập trung.
Vấn đề về khả năng mở rộng
Joancomartí et al. đã nghiên cứu về những vấn đề liên quan đến khả năng mở rộng của Bitcoin và đưa ra một vài giải pháp. Họ xác nhận rằng nguy cơ delays không phải là vấn đề duy nhất.
Bootstrap time là khoảng thời gian một node mới cần để gia nhập vào mạng lưới, download và phân tích lịch sử hình thành và phát triển của mạng lưới, điều mà đối với một blockchain lâu đời và khổng lồ như Bitcoin có thể gây hao tổn chi phí và thời gian.
Đã có nghiên cứu một vài giải pháp :
- Giảm khối lượng thông tin cần thiết ở mỗi phiên giao dịch để gây nhiễu nhiều đợt giao dịch trong một khối.
- Thay đổi kích cỡ của khối để tìm kiếm kích cỡ tối ưu nhất
Nhìn chung, vấn đề liên quan đến khả năng mở rộng của blockchain có thể được chia làm 3 nhóm chính: Thông lượng, Chi phí và Dung lượng.
Dung lượng là quy mô của tất cả các phiên giao dịch trước đấy mà người đào nên lưu trữ. Khối lượng này sẽ tăng lên từng ngày. Kể cả mỗi phiên giao dịch nhỏ cũng cần phải trả phí.
Vì vậy, vấn đề thông lượng xảy ra khi các phiên giao dịch phải chờ để trở thành một phần của khối. Do giới hạn về kích thước khối, thời gian hoàn thành có thể bị lâu hơn rất nhiều.
Kiểm soát truy cập
Mặc dù bản ghi của các giao dịch trước được lưu trữ trên Blockchain, và một lượng lớn dữ liệu phải được sao chép trên mỗi node, chúng ta không nên coi blockchain như một cơ sở dữ liệu.
Hai đặc điểm kỹ thuật chính này có thể gây ra blockchain bloat nếu các file quá lớn được lưu trữ trên hệ thống. Đối với vấn đề này, các files lớn được lưu trữ off-chain. Thế nhưng, mạng lưới lưu trữ trên blockchain không cho phép việc chia sẻ tài liệu được diễn ra giữa những người sử dụng.
Để khắc phục vấn đề này, Steichen et al năm 2018 đã cung cấp một giải pháp dựa trên hợp đồng thông minh, tuy nhiên nó chỉ giải quyết được vấn đề của IPFS.
Vấn đề của Reputation System
Các kết quả bắt nguồn từ quan điểm của nodes – vốn không phải là một kết quả đáng tin. Để giải quyết vấn đề này, các nhà phát triển đưa ra một local reputation system, trong đó chỉ đưa ra những kiến nghị của người dùng vùng lân cận. Kế hoạch này có thể được thực hiện trong các hệ thống blockchain để trao quyền cho chúng ta để sử dụng những kiến nghị từ những người mà ta tin tưởng.
Chuyển đổi lưu trữ phi tập trung
Các mạng lưới lưu trữ của blockchain là một công nghệ hoàn toàn mới, thoạt nhìn vô cùng hấp dẫn đối với doanh nghiệp nhưng việc chuyển đổi sang mạng lưới blockchain không phải là biện pháp tốt nhất ở thời điểm hiện tại.
Đối với cá nhân thì có thể chuyển đổi dễ dàng hơn và có thể bắt đầu trải nghiệm miễn phí với Web3.Storage. Web3.Storage đang có chương trình trải nghiệm miễn phí 1TB.
Dự phóng mảng lưu trữ phi tập trung
Chúng ta có thể thấy rằng việc lưu trữ dữ liệu là rất quan trọng, đặc biệt là trong bối cảnh hiện tại dữ liệu của mình có thể bị đánh cắp và sử dụng bất cứ lúc nào. Việc lưu trữ phi tập trung, mã hóa dữ liệu mà nhu cầu thiết yếu và cần thiết để bảo vệ thông tin.
Các dự án mới đang phát triển về NFT, đặc biệt là Gaming rất cần những dịch vụ lưu trữ phi tập trung để lưu trữ assets một cách phi tập trung thật sự.
Ngoài ra, lưu trữ phi tập trung còn có tiềm năng phát triển ở cả thị trường truyền thống. Vì vậy, cơ hội và tiềm năng của mảng decentralized storage là rất lớn.
GFS đã có bài viết ứng dụng và tiềm năng của lưu trữ phi tập trung cho mảnh ghép NFT, Oracles…tại đây.
Bên cạnh đó, lưu trữ phi tập trung sẽ cần giải quyết được những vấn đề đã nêu trong bài viết để có thể sánh vai với các nhà cung cấp dịch vụ lưu trữ tập trung trong thời gian tới.
Tham khảo thêm: Top 5 dự án lưu trữ dữ liệu phi tập trung phổ biến nhất 2022