Tổng quan
Khi internet phổ cập, web đã trở thành một trong những thành tựu vĩ đại nhất tạo nên lịch sử nhân loại, chịu trách nhiệm về những thành tựu chưa từng thấy trong khoa học, công nghệ và thương mại. Một trong những điểm quan trọng góp phần tạo lên sự thành công của web là lưu trữ đám mây, nơi dữ liệu được lưu trữ trong các máy chủ lớn, tập trung do các tập đoàn công nghệ sở hữu và điều hành. Nhưng vì sự tập trung này làm cho các giữ liệu bị kiểm soát, làm mất đi quyền riêng tư, hay giá lưu trữ duy trì ở mức cao một cách thiếu minh bạch và tạo ra các nút thắt cổ chai ngăn cản việc sử dụng dữ liệu mới. Nhưng giờ đây cùng với sự phát triển của công nghệ Blokchain, đã giúp cho công nghệ lưu trữ đám mây trở lên minh bạch và phi tập trung hơn. Trong bài viết này chúng ta hãy cùng nhau tìm hiểu về lưu trữ dữ liệu đám mây phi tập trung nhé!
*** Bài viết này thuộc chuỗi Series Storage Workspace của GFS Blockchain nhằm nghiên cứu từ căn bản tới nâng cao cũng như tốc độ phát triển hiện tại về lĩnh vực Storage – Một mảnh ghép không thể thiếu của bất kỳ Hệ tính thái nào. Tổng hợp các bài viết của Storage Workspace –> Xem tại đây
Lưu trữ đám mây là gì?
Lưu trữ đám mây hay còn được gọi với một cái tên khác là Cloud Storage. Đây là một dịch vụ cho phép dùng có thể lưu trữ, quản lý, chia sẻ, sao lưu các dữ liệu một cách hiệu quả. Dù dữ liệu của người dùng là hình ảnh, video hay tập tin đều có thể dễ dàng lưu trữ tại dịch vụ lưu trữ đám mây.
Dịch vụ Cloud Storage được cấp bởi một công ty hoặc doanh nghiệp nào đó, có thể là các doanh nghiệp trong nước và nước ngoài. Dịch vụ lưu trữ đám mây là thuật ngữ dùng để chỉ các hành động lưu dữ, sắp xếp quản lý dữ liệu,….từ xa vô cùng hiệu quả. Do đó sử dụng dịch vụ này sẽ giúp người dùng có thể quản lý dữ liệu tại bất kỳ đâu và bất kỳ nơi nào muốn, điều kiện chỉ cần thiết bị điện thoại, máy tính có kết nối Internet. Thay vì lưu trữ dữ liệu vào ổ cứng, USB, đĩa ghi,… như thông thường khi internet chưa phổ cập, thì giờ đây người dùng có thể lưu tại Cloud Storage, nơi có thể lưu trữ tất cả mọi dữ liệu và không có giới hạn.
Thông qua kết nối Internet, người dùng có thể truy xuất dữ liệu tại Cloud Storage dễ dàng như đang truy cập dữ liệu trên ổ cứng máy tính. Vậy nên ngày nay dịch vụ Cloud Storage được ứng dụng rộng rãi và trở thành kho lưu trữ quan trọng cất giữ lượng dữ liệu lớn.
Một số công ty về lưu trữ đám mây lớn hiện nay như: Google Drive, Dropbox, Fshare, OneDrive, iCloud, Box, …
Ưu điểm của lưu trữ đám mây
Lưu trữ đám mây hoạt động dựa theo hai nhóm chính đó là cá nhân hay còn được biết đến là người dùng và Doanh nghiệp. Và đám mây phi tập trung hay đám mây tập trung đều có những ưu điểm chung.
Đối với người dùng:
- Tiện lợi, nhanh chóng, dễ dàng: Bạn có thể gặp nhiều rắc rối nếu cóp nhầm file cho buổi họp quan trọng, nhưng lưu trữ đám mây sẽ giúp bạn giải quyết vấn đề này, chúng ta chỉ cần kéo và thả tệp trên các giao diện hay ứng dụng thân thiện, đơn giản, tối ưu đã được các công ty tối ưu hóa.
- Tính sẵn sàng cao: Người dùng có thể yên tâm truy cập và làm việc với dữ liệu của họ ở bất cứ đâu vào bất cứ khi nào với kết nối internet. Với mức độ phát triển và phủ sóng internet như hiện nay thì điều này gần như không có trở ngoại nào.
- Tiết kiệm thời gian: Các dịch vụ lưu trữ đám mây đa só đều có băng thông cao, nhờ đó có thể giúp người dùng tiết kiệm được rất nhiều thời gian. Thay vì phải chờ đợi tải file qua mail, hay từ các thiết bị usb.
- Tiết kiệm tiền bạc: Lợi ích vật chất mà người dùng có thể hưởng lợi từ lưu trữ đám mây là việc cắt giảm được một khoản chi phí lớn cho những ổ cứng đắt đỏ trong khi được sử dụng một khối lượng dung lượng miễn phí không hề nhỏ.
Đối với Doanh nghiệp:
- Tiết kiệm thời gian và không gian: Triển khai nhanh, giảm thời gian chuyển giao dữu liệu. Không tốn không gian cho lưu trữ thiết bị.
- Tính linh hoạt cao: Cho phép việc giao tiếp, thực hiện công việc liền mạch, nhanh chóng, giúp gia tăng hiệu suất công việc.
- Nâng cao bảo mật, khôi phục thiệt hại: Các bản sao dữ liệu của người dùng vẫn luôn được lưu trong đám mây, vì vậy các mối nguy như việc dữ liệu bị mất, bị đánh cắp hay phá hủy đều được giải quyết.
- Tiết kiệm chi phí: Vấn đề chi phí luôn là bài toán tối ưu của bất cứ doanh nghiệp nào. Vậy nên, lưu trữ đám mây sẽ giúp doanh nghiệp tiết kiệm được một khoản chi rất lớn cho các phần cứng, ổ cứng hay phí bảo trì, nâng cấp tốn kém….
Lưu trữ đám mây phi tập trung
Nói một cách đơn giản, lưu trữ đám mây phi tập trung là một ứng dụng của công nghệ blockchain để hỗ trợ quyền riêng tư và bảo mật trong lưu trữ dữ liệu. Từ lâu, nó đã trở thành lựa chọn ưu tiên để lưu trữ dữ liệu trực tuyến bởi các nhà cung cấp như Amazon và Microsoft.
Không giống như đám mây dữ liệu tập trung, nơi dữ liệu được lưu trữ trên nhiều máy chủ được lưu trữ trong cơ sở dữ liệu trung tâm, đám mây dữ liệu phi tập trung liên quan đến việc lưu trữ dữ liệu trên nhiều máy tính, còn được gọi là các nút. Trong hệ thống lưu trữ phi tập trung, giống như bất kỳ hệ thống lưu trữ tập trung nào, bạn có thể tải lên và tải xuống các tệp từ mạng nếu cần.
Tuy nhiên, các nút trong hệ thống lưu trữ phi tập trung không thể xem hoặc sửa đổi tệp của bạn. Điều này là do tất cả dữ liệu bạn tải lên mạng lưu trữ phi tập trung đều được mã hóa theo mặc định. Do tính năng này, một đám mây dữ liệu phi tập trung rất quan trọng đối với việc lưu trữ các NFT.
Ưu Điểm của đám mây phi tập trung
Lưu trữ phi tập trung đã phát triển để giải quyết những thách thức và hạn chế của lưu trữ tập trung. Dưới đây là một số cách mà lưu trữ phi tập trung vượt trội hơn lưu trữ tập trung, khiến nó trở thành một giải pháp thay thế hợp lý cho các tùy chọn lưu trữ đám mây truyền thống.
- Tiết kiệm: Không giống như các hệ thống lưu trữ tập trung trong đó một số trung tâm dữ liệu hữu hạn lưu trữ dữ liệu của người dùng, mạng lưu trữ phi tập trung bao gồm hàng triệu nút sẵn sàng lưu trữ dữ liệu của bạn một cách an toàn. Điều này không chỉ cung cấp một lượng lớn băng thông lưu trữ mà còn giảm chi phí lưu trữ, giúp giảm các khoản phí.
- Định giá hợp lý: Trong bất kỳ mạng lưu trữ phi tập trung nào, luôn có sự cạnh tranh giữa các nút lưu trữ vì chỉ những nút phù hợp nhất mới có xu hướng được khuyến khích. Do sự cạnh tranh như vậy, khả năng xảy ra các hành vi chống cạnh tranh, độc quyền và giá cả không công bằng là gần không còn. Do đó, người dùng có thể được hưởng mức giá hợp lý khi đăng ký lưu trữ phi tập trung.
- Hạn chế rủi ro: Trong bất kỳ hệ thống lưu trữ phi tập trung nào, hàng triệu nút có xu hướng tham gia và lưu trữ dữ liệu của người dùng. Điều này giúp tạo nhiều bản sao và đảm bảo rằng không bị mất dữ liệu khi xảy ra bất kỳ trường hợp không lường trước nào.
- Bảo mật & Riêng tư: Có hai yếu tố vững chắc góp phần vào các tiêu chuẩn cao về quyền riêng tư và bảo mật mà các hệ thống lưu trữ phi tập trung cung cấp. Yếu tố đầu tiên là thực tế là tất cả dữ liệu đã được mã hóa. Yếu tố thứ hai là dữ liệu, ngoài việc được mã hóa, sau đó được chia thành hàng triệu nút lưu trữ. Điều này giúp cho dữ liệu được an toàn ngay cả khi một nút bị tấn công.
- Nhanh: Việc gặp phải tình trạng tắc nghẽn mạng với các hệ thống lưu trữ tập trung là điều thường thấy vì đôi khi lưu lượng mạng có thể lấn át các máy chủ. Tuy nhiên, trong một mạng lưu trữ phi tập trung, nhiều bản sao dữ liệu được lưu trữ trên các nút khác nhau. Điều này giúp loại bỏ khả năng tắc nghẽn mạng vì bạn có thể truy cập dữ liệu của mình từ một số lượng lớn các nút, một cách nhanh chóng và an toàn.
Đặc tính cần có của đám mây phi tập trung
- Cơ chế bền vững: Một cơ chế bền vững hoặc một cấu trúc khuyến khích là cơ bản để đảm bảo rằng dữ liệu được lưu trữ một cách an toàn và bảo mật trên một mạng phi tập trung. Ví dụ, Ethereum tuân theo một cơ chế bền vững được gọi là “sự bền bỉ dựa trên chuỗi khối”. Vì cơ chế bền vững của Ethereum không bền vững để lưu trữ lượng lớn dữ liệu một cách hiệu quả, nên mỗi nhà cung cấp dịch vụ lưu trữ phi tập trung có một cấu trúc khuyến khích và cơ chế duy trì của riêng họ. Tính kiên trì dựa trên hợp đồng là một cấu trúc khuyến khích khác mà một số nhà cung cấp dịch vụ lưu trữ phi tập trung như Filecoin và Storj có xu hướng tuân theo. Trong mô hình này, các thỏa thuận hợp đồng được thực thi để đảm bảo rằng dữ liệu được lưu trữ trong một số lượng nút nhất định trong một khoảng thời gian đã thỏa thuận.
- Thực thi lưu giữ dữ liệu: Thực thi lưu giữ dữ liệu là một cơ chế đảm bảo dữ liệu được giữ lại, với các thách thức về mật mã là cơ chế phổ biến để kiểm tra xem một nút có còn dữ liệu hay không. Cơ chế Proof-of-access của Arweave là một ví dụ về việc thực thi lưu giữ dữ liệu. Các nút bắt buộc phải hoàn thành một thử thách để kiểm tra xem dữ liệu có xuất hiện trong cả nút gần đây nhất và một số nút ngẫu nhiên trong quá khứ hay không. Trong trường hợp các nút không hoàn thành thử thách, chúng sẽ bị phạt.
- Sự đoan chính: Mặc dù có một cách tiếp cận phù hợp với tất cả để xác định mức độ “phi tập trung” của nhà cung cấp dịch vụ lưu trữ, nhưng bạn nên đăng ký các dịch vụ và công cụ hiển thị một dạng KYC nhất định để xác định tính phi tập trung của họ. .
- Cơ chế đồng thuận: đồng thuận là một quá trình mà qua đó tất cả các nút trong mạng lưu trữ phi tập trung hoặc mạng blockchain đạt được thỏa thuận liên quan đến trạng thái của sổ cái phân tán. Mặc dù mỗi nhà cung cấp dịch vụ lưu trữ phi tập trung có thể có một cơ chế đồng thuận của riêng họ, nhưng bằng chứng cổ phần (PoS) và bằng chứng công việc (PoW) là hai cơ chế phổ biến mà hầu hết các cơ chế khác đều dựa trên đó.
Ứng dụng đối với Blockchain
Có thể nói bất cứ công nghệ hay lĩnh vực nào đều cần sử dụng tới dữ liệu, tùy vào mục đích sử dụng và chia sẻ mà có những cách lưu trữ khác nhau nhằm tối ưu hóa lợi nhuận, đối với một số công ty họ có thể tự tạo ra được kho lưu trữ riêng hoặc họ có thể thuê lại từ công ty khác. Chúng ta có thể nhận ra rằng các dữ liệu trên Blockchain đều minh bạch, công khai và không thể xóa đi được, chính vì vậy lượng dữ liệu trên các blockchain là cực kì lớn và ngày một nhiều.
Blockchain cần tính mình bạch và tính không đổi, chính vì vậy lưu trữ phi tập trung là điều cần thiết để đáp ứng nhu cầu trên, các dữ liệu mà blockchain tạo ra có tính bất biến và không bao giờ bị xóa đi. Vì vậy để các công ty có thể tự lưu trữ hết các dữ liệu của mình thì gần như là rất khó, và bắt buộc họ sẽ phải sử dụng các kho lưu trữ từ bên thứ 3 cung cấp.
Các lĩnh vực trong blockchain cần lưu trữ dữ liệu lớn: Cơ sở hạ tầng, Oracles, NFT, Web3, Metaverse, dữ liệu on-chain of-chain, Game, ….
Xem thêm chi tiết về ứng dụng và tiềm năng của lưu trữ dữ liệu ==> tại đây.
Các giải pháp lưu trữ dữ liệu blockchain
Có nhiều cách khác nhau để lưu trữ dữ liệu blockchain. Dưới đây, chúng ta tìm hiểu một số cách lưu trữ cụ thể như sau:
Lưu trữ dữ liệu dạng thô
Việc lưu trữ dữ liệu dưới dạng thô và đầy đủ trong blockchain là giải pháp lưu trữ dữ liệu blockchain đơn giản nhất. Hiện nay hầu hết các ứng dụng phi tập trung đơn giản sử dụng giải pháp này. Tuy nhiên, cách tiếp cận này có rất nhiều nhược điểm đáng kể.
Đầu tiên đó là ảnh hưởng của nó đến tốc độ xác nhận giao dịch trên blockchain. Khi khối lượng dữ liệu tăng lên, thời gian để quét qua và tính toán để xác nhận giao dịch càng tăng. Điều này có thể không ảnh hưởng nhiều trong trường hợp giao dịch tiền tệ bởi các giao dịch có thể diễn ra khá nhanh chóng (khoảng một vài phút, và điều này cũng không ảnh hưởng nhiều đến người dùng). Tuy nhiên, đối với các ứng dụng yêu cầu luồng xử lý dữ liệu lớn và phức tạp thì điều này sẽ gây rất nhiều vấn đề về tốc độ.
Rất nhiều ứng dụng có thể yêu cầu xử lý hàng chục ngàn giao dịch mỗi giây. Chẳng hạn như các ứng dụng trong xử lý dữ liệu IoT hoặc trong các ứng dụng quản lý chuỗi cung ứng, xử lý thông tin mạng xã hội,… thì phương pháp này rõ ràng rất bất lợi.
Thứ hai, là tính bất biến của dữ liệu. Tính bất biến của dữ liệu là một điểm mạnh của blockchain trong việc đảm bảo tính an toàn cho hệ thống nhưng nó lại là điểm yếu cho việc lưu trữ dữ liệu. Trong nhiều trường hợp người dùng có thể có các yêu cầu để thay đổi thông tin hoặc dữ liệu nào đó của họ. Chẳng hạn như thông tin cá nhân bị up nhầm hoặc các thông tin bắt buộc phải thay đổi. Chúng ta có thể “Thêm – Sửa – Xóa” dữ liệu một cách bình thường trên các hệ thống lưu trữ tập trung. Tuy nhiên với blockchain tất cả các dữ liệu được lưu trữ trước đó sẽ nằm trong blockchain mãi mãi và bất kỳ ai cũng có thể nhìn thấy và không thể thay đổi.
Tính bất biến còn dẫn đến một nhược điểm nữa trong việc lưu trữ dữ liệu blockchain đó là năng lực lưu trữ hay tính hiệu quả. Nếu tất cả các ứng dụng đều giữ dữ liệu của mình dưới dạng thô đầy đủ trên blockchain, thì kích thước blockchain sẽ ngày càng tăng nhanh, vượt quá dung lượng ổ cứng có thể đáp ứng được của các node lưu trữ công khai. Các node đầy đủ được sử dụng để làm các node xác thực của blockchain có thể sẽ yêu cầu các loại phần cứng đặc biệt. Điều này có thể dẫn đến việc tập trung hóa của blockchain. Đó là lý do tại sao lưu trữ dữ liệu đầy đủ dưới dạng thô trong blockchain không phải là một lựa chọn tốt đối với một ứng dụng phi tập trung đòi hỏi xử lý nhiều dữ liệu.
Lưu trữ dữ liệu dạng băm
Để khắc phục vấn đề đối với dung lượng lưu trữ dữ liệu blockchain, một giải pháp có thể được sử dụng đó là sử dụng giải pháp lưu trữ dữ liệu dưới dạng giá trị băm. Chẳng hạn thay vì toàn bộ một file nhạc .mp3 với dung lượng 4MB chúng ta có thể lưu nó dưới dạng giá trị băm tương ứng chỉ gồm 160 bit (20 byte).
Hàm băm sẽ tạo ra các bản tóm lược của dữ liệu đầu vào và đại diện cho đầu vào. Mỗi đầu vào khác nhau sẽ cho ra đầu ra hoàn toàn khác nhau và mỗi đầu vào chỉ tạo ra một đầu ra duy nhất. Do đó, từ việc xem xét sự thay đổi của giá trị băm của đầu vào, chúng ta có thể xác định xem liệu dữ liệu đầu vào gốc có bị thay đổi hay không?
Một tính chất quan trọng khác của hàm băm đó là nó sẽ tạo ra được những giá trị có độ dài cố định và thường rất nhỏ từ dữ liệu có kích thước bất kỳ (thường rất lớn – lớn hơn rất nhiều so với giá trị băm). Do đó, khi lưu trữ giá trị băm thay vì dữ liệu thô gốc chúng ta sẽ tiết kiệm được khá nhiều không gian lưu trữ và tài nguyên cần thiết.
Trong trường hợp này, dữ liệu thô gốc có thể được lưu trữ theo bất kỳ cách nào chúng ta muốn. Ví dụ: chúng ta có thể sử dụng các hệ cơ sở dữ liệu quan hệ như SQL hoặc chỉ đơn giản là lưu nó dưới dạng một tệp hay hệ thống tệp tại máy cục bộ.
Điều duy nhất chúng ta cần chú ý là đảm bảo rằng chúng ta liên kết chính xác giá trị băm của dữ liệu trên blockchain tương ứng với dữ liệu thô mà chúng ta cần lưu trữ. Chẳng hạn trong cơ sở dữ liệu quan hệ, chúng ta sẽ thêm một cột khác để lưu trữ giá trị băm này và liên kết đến dữ liệu thô tương ứng.
Với giải pháp này, chúng ta có thể sử dụng các lợi thế của các cơ chế lưu trữ truyền thống (như truy vấn dữ liệu quan hệ) trong khi vẫn đảm bảo được việc chứng minh giả mạo của blockchain. Bất cứ khi nào, chúng ta nghi ngờ về dữ liệu, chúng ta đều có thể băm dữ liệu thô và so sánh nó với giá trị băm được chỉ định trong blockchain.
Lưu trữ hỗn hợp dữ liệu
Để khắc phục vấn đề về mất tính phân cấp và minh bạch đối với phương pháp lưu trữ giá trị băm. Chúng ta có thể sử dụng biện pháp lưu trữ một phần dữ liệu thô kết hợp với giá trị băm của dữ liệu trên blockchain. Giải pháp lưu trữ này có thể giải quyết được một mức độ nhất định vấn đề về tính phân cấp cũng như minh bạch ở trên.
Điều này tùy thuộc vào các phần của dữ liệu được lưu trữ. Trong trường hợp này tính minh bạch được đáp ứng bởi dữ liệu gốc hiện có có thể được truy cập công khai. Ngoài ra, do một tập hợp con của dữ liệu được lưu trữ phi tập trung thay vì được lưu trữ trong cơ sở dữ liệu trung tâm do đó nó vẫn đáp ứng được tính phi tập trung của ứng dụng.
Tổng kết
Lưu trữ dữ liệu và ngành công nghiệp luôn song hành và không thể thiếu đối với lịch sử phát triển của công nghệ nói riêng và lịch sử con người nói chung. Tất nhiên đám mây phi tập trung là điều mà con người muốn hướng tới để trách sự kiểm soát và thao túng dữ liệu của một số tổ chức, nhưng không phải tất cả các công ty, người dùng đều muốn công khi dữ liệu của mình. Vì vậy còn tùy phụ thuộc vào sự chấp nhận của người dùng để có thể giúp cho lĩnh vực này có thể phát triển nhanh hơn trong tương lai.