Xây dựng quy chế quyền tài sản cho dữ liệu: nhu cầu và thách thức pháp lý

11/09/2023

TS. ĐỖ GIANG NAM

Khoa Luật Dân Sự, Trường Đại học Luật, Đại học Quốc gia Hà Nội,

THS. ĐÀO TRỌNG KHÔI

Khoa Luật Dân Sự, Trường Đại học Luật, Đại học Quốc gia Hà Nội.

Tóm tắt: Trong bối cảnh sự phát triển nhanh chóng của nền kinh tế số, đã xuất hiện ngày càng nhiều đề xuất nên coi dữ liệu là đối tượng của luật tài sản để khai thác tối đa những lợi ích từ dữ liệu với tư cách là nguồn ‘dầu mỏ mới’. Trong bài viết này, các tác giả phân tích khả năng tài sản hoá dữ liệu và nhấn mạnh rằng nếu dữ liệu có đủ tính xác định và tính luật định thì có thể trở thành tài sản. Tuy nhiên, quá trình xây dựng quy chế quyền tài sản cho dữ liệu sẽ phải đối mặt với những thách thức không nhỏ từ chính những đặc tính phức tạp của đối tượng rất mới và giá trị này.
Từ khoá: Dữ liệu, tài sản hoá dữ liệu, kinh tế số.
Abstract:In the context of the recent development of the digital economy, numerous proposals call to consider data as an object of property law to exploit its unique features known as the ‘new oil'. Under this article, the authors provide an analysis of the possibility of data propertization and argue that data might become a property if it meets the specificity requirement and the numerus clausus principle. However, the development process of regulations on data propertization has been confronting significant challenges due to the characteristics of this very new and valuable object.
Keywords: Data; data propertization; digital economy.
 QUYỀN-TÀI-SẢN-CHO-DỮ-LIỆU.jpg
Ảnh minh họa: Nguồn internet
1. Bản chất của dữ liệu từ góc nhìn đa chiều
1.1. Định nghĩa dữ liệu
Dù đã được con người biết đến, lưu trữ và khai thác trong một thời gian dài, dữ liệu vẫn chưa được định nghĩa một cách rõ ràng và thống nhất. Từ điển Oxford giải thích dữ liệu (data) là các “sự thật hoặc thông tin, được sử dụng để nhận biết hoặc đưa ra quyết định”[1]. Khoa học thống kê coi dữ liệu là những thứ “được thu thập để trở thành nguồn phục vụ cho việc trích xuất thông tin”, là “kết quả của đo đạc và quan sát”[2]. Tổ chức Hợp tác và Phát triển kinh tế  (OECD) cũng định nghĩa dữ liệu là “sự thể hiện dưới dạng vật lý của thông tin, để phục vụ cho việc giao tiếp, giải thích, xử lý của con người hoặc của các máy móc tự động”,[3] hay một “tính chất hoặc thông tin” mà “được thu thập thông qua việc quan sát”[4].   
Khoa học dữ liệu lại có cách tiếp cận sâu và phức tạp hơn, chủ yếu theo mô hình “DIKW” nổi tiếng của Ackoff trong tác phẩm “Từ Dữ liệu đến trí tuệ” (From Data to Wisdom)[5]. Theo đó, dữ liệu có bản chất là các “dấu hiệu” (sign) có tính chất quan trọng với một chủ thể nhất định[6]. Mỗi giây con người có thể phải đối diện với rất nhiều dấu hiệu hoặc kích thích, nhưng chỉ một vài dấu hiệu trong số đó là "quan trọng" đối với họ. Con người sẽ liên kết các “dấu hiệu quan trọng” như vậy với một ý nghĩa nhất định, sau đó ghi nhớ các dấu hiệu đó để hình thành thứ gọi là “dữ liệu” (data). Như vậy, chỉ có những dấu hiệu đủ “quan trọng”, qua được "bộ lọc tri giác” (perceptual filter) này thì mới được coi là “dữ liệu”. Trong các “dữ liệu” đó lại chỉ một số dấu hiệu vượt qua "bộ lọc ý niệm” (conceptual filter), tức là có thể liên kết được với một đối tượng, sự vật khác, hoặc giúp làm rõ đặc tính nội tại của những đối tượng, sự vật đó, thì mới có thể trở thành “thông tin” (information)[7]. Tiếp theo, nếu người nào lại liên kết các “thông tin” đó sâu hơn hoặc sắp xếp chúng vào các mô hình tri thức có giá trị khác đã được học hỏi và trải nghiệm từ trước, người đó sẽ tạo ra các “kiến ​​thức” (knowledge), rồi cuối cùng khái quát thành tri thức (Wisdom)[8].             
Mặc dù vậy, khoa học pháp lý nói chung vẫn chưa hiểu về dữ liệu thống nhất với các cách hiểu trên, chưa phân biệt rõ “dữ liệu” với “thông tin”. Nhiều đạo luật vẫn sử dụng “dữ liệu” đồng nghĩa với từ “thông tin”[9], chẳng hạn như Điều 4 của GDPR[10] định nghĩa "dữ liệu cá nhân" là bất kỳ "thông tin" nào liên quan đến một thể nhân được xác định hoặc có thể nhận dạng được[11]. Một số ý kiến khác lại gắn chặt dữ liệu với tính điện tử, tính số hoá của nó khi định nghĩa dữ liệu là “bất kỳ thông tin nào được ghi lại”, “bởi con người hay máy móc” và “bằng các phương tiện điện tử hoặc kỹ thuật số” mà “có thể truy xuất được”[12]. Mặc dù vậy, các luật gia dần dần nhìn nhận dữ liệu theo cách nhìn của các khoa học khác và bước đầu ghi nhận tương tự các định nghĩa về dữ liệu theo mô hình DIKW. Theo đó, các tín hiệu /dấu hiệu (sign) tồn tại một cách khách quan, trước khi được người nhận tín hiệu phát hiện và thu thập. Dữ liệu là cầu nối giữa hình thức vật lý chứa đựng nó (“vật chứa đựng”) với “thông tin” - thứ được ngữ cảnh hóa và xử lý từ dữ liệu[13]. Theo tiêu chuẩn ISO/IEC 2382-1 của Ủy ban Châu Âu, dữ liệu là "sự trình bày có thể diễn giải lại của thông tin theo cách thức được chính thức hóa, phục vụ quá trình giao tiếp, diễn giải hoặc xử lý"[14]. Tổng hợp và phân tích các định nghĩa kể trên, có thể nhận thấy “dữ liệu” trong sự so sánh với “thông tin” có những điểm cần chú ý như sau. Thứ nhất, “dữ liệu” nên được hiểu tách biệt ra khỏi định nghĩa về “thông tin”. Dữ liệu có bản chất là các dấu hiệu (sign), hoặc nhiều dấu hiệu được tập hợp lại thành hệ thống. Nếu như dữ liệu là hình thức thể hiện (syntactic) thì thông tin là ngữ nghĩa nội dung (semantic) có thể trích xuất được từ hình thức thể hiện đó[15]. Do đó, dữ liệu thường “thô”, giản đơn và không phức tạp như “thông tin”, bởi chúng cần được khái quát để trở thành “thông tin”. Thứ hai, dữ liệu không thể tồn tại khi không có hình thức vật lý chứa đựng dữ liệu (“vật chứa đựng”), bởi chính dữ liệu là cầu nối liên kết “vật chứa đựng” với “thông tin”. Nói cách khác, để một dấu hiệu có thể trở thành dữ liệu, cần có một vật chứa đựng lưu lại dấu hiệu đó, là cơ sở để các chủ thể có thể tiếp cận và sau đó khai thác thông tin từ chúng[16]. Trên thực tế, mỗi giây con người tiếp xúc với vô vàn các dấu hiệu (ánh sáng, âm thanh, v.v..) thông qua các giác quan (xúc giác, thị giác…), nhưng chỉ có những dấu hiệu nào được lưu lại vào vật chứa đựng (giấy, bộ nhớ) thì mới được coi là dữ liệu.          
Mối tương quan và khác biệt giữa “dữ liệu”, “thông tin” và “vật chứa đựng” có thể được làm rõ qua ví dụ sau[17]: Khi một miếng đá có các chữ tượng hình cổ đại được khai quật, miếng đá chính là hình thức vật lý (carrier) chứa đựng các nét khắc là các dấu hiệu - dữ liệu (data). Tuy nhiên, nếu không có kiến thức về ngôn ngữ tượng hình, gần như không thể trích xuất được các ý nghĩa - thông tin (information) từ miếng đá, chẳng hạn tiểu sử của một vị vua được khắc trên phiến đá. Phiến đá cũng có thể đem tới những dấu hiệu khác (ví dụ như sự mờ đục trong nét chữ hay các vết đứt gãy) – là các dữ liệu khác, là căn cứ để các nhà khảo cổ tổng hợp và phân tích nhằm tìm ra thêm thông tin về chính phiến đá đó (ví dụ niên đại, kỹ thuật điêu khắc…). Nếu một người chép lại toàn bộ các ký tự tượng hình sang một phiến đá mới, thì không thể coi là đã chuyển thành công dữ liệu sang phiến đá mới, mà thực ra chỉ là việc kiến tạo một lượng dữ liệu mới với mục đích cùng thể hiện nội dung ý nghĩa – thông tin gần giống với bản gốc mà thôi[18]. Như vậy, dưới góc nhìn pháp lý, dữ liệu có thể được hiểu là một hoặc một tập hợp các dấu hiệu đóng một vai trò nhất định với một chủ thể và được gắn kết với một hình thức vật lý nhất định.
1.2. Phân loại dữ liệu
Có nhiều cách phân loại dữ liệu, mà cách đầu tiên là theo hình thức của chúng: (i) dữ liệu số được thu thập và xử lý, lưu trữ bằng công nghệ máy tính, và (ii) dữ liệu truyền thống không có sự can thiệp của công nghệ này. Tiêu chí phân loại thứ hai phổ biến hơn là dựa vào nội dung của dữ liệu. Trong mối quan hệ với con người, dữ liệu có thể được chia thành dữ liệu cá nhân (personal) và phi cá nhân (non-personal). Dữ liệu cá nhân thường được hiểu là các dữ liệu mà có bản chất liên quan đến hoặc gắn liền với một cá nhân đặc định, là “bất kỳ thông tin nào giúp xác định hoặc nhận dạng được một cá nhân”[19]. Đồng thời, một số phần thông tin rời rạc chưa giúp nhận dạng một cá nhân, nhưng khi được tổng hợp mà dẫn đến việc xác định được một con người cụ thể thì cũng bị coi là dữ liệu cá nhân. Thậm chí, kể cả khi dữ liệu đó đã được loại bỏ yếu tố giúp xác định danh tính (de-identified), được mã hoá (encrypted) nhưng vẫn có thể được tổng hợp và khai thác để định danh một cá nhân thì vẫn bị coi là dữ liệu cá nhân[20]. Các dữ liệu không có những yếu tố kể trên thì được xếp vào loại dữ liệu phi cá nhân. Ritter và Mayer thì còn phân biệt dữ liệu dựa vào tính thực tế: Sự kiện (factual) là dữ liệu ghi lại những mô tả thực tế về sự vật, sự việc; trong khi Giả tưởng (fictional) là những dữ liệu mô tả những thứ do con người sáng tạo ra, như thơ văn, phim ảnh[21].           
Tuy nhiên, cũng có ý kiến phản đối cách phân loại phổ biến dựa trên nội dung này. Chẳng hạn, Vaclav cho rằng, dữ liệu nào cũng có thể có tính cá nhân sau khi được phân tích tổng hợp, hoặc cũng có thể không có tính cá nhân nếu không có các công cụ đủ mạnh để liên kết dữ liệu đó với một cá nhân nhất định. Vì thế, dữ liệu thuần tuý chỉ là dữ liệu thô, còn nội dung nào được rút ra từ chúng thì sẽ phụ thuộc vào các yếu tố ngoại vi, và không thể là căn cứ để phân loại dữ liệu. Nếu như thực sự có một số dữ liệu tự thân đã có bản chất gắn liền với một cá nhân thì đó chỉ có thể là các dữ liệu rất đặc thù, ví dụ như về DNA trong gen của mỗi người, hoặc các mẫu vật hay phần của cơ thể người[22].           
Một cách phân loại khác là dựa trên chủ thể thu thập dữ liệu. Uỷ ban Châu Âu phân loại dữ liệu do con người thu thập với dữ liệu hoàn toàn do máy móc thu thập qua các cảm biến tự động[23], với đại diện phổ biến nhất là dữ liệu thu thập bởi xe tự lái. Dựa trên mục đích, Floridi còn chia dữ liệu thành: dữ liệu gốc (primary data) được thu thập từ đối tượng, dữ liệu mô tả (metadata) nói lên bản chất của dữ liệu gốc, dữ liệu điều hành (operational) thể hiện cách hệ thống xử lý dữ liệu hoạt động, và dữ liệu phái sinh (derivative) có được từ việc khái quát các dữ liệu kể trên[24]
2. Các thách thức pháp lý của việc xây dựng quy chế quyền tài sản cho dữ liệu
2.1. Những nguyên lý căn bản khi xây dựng quy chế quyền tài sản cho dữ liệu
Từ góc nhìn của hệ thống luật tư, có một sự phân biệt phổ quát trên thế giới giữa nguyên lý của luật tài sản (hay vật quyền/quyền tài sản - theo nghĩa rộng) và nguyên lý của luật nghĩa vụ (hay trái quyền). Về cơ bản, trong quan hệ nghĩa vụ giữa hai chủ thể nhất định, trái quyền nếu phát sinh thì chỉ có hiệu lực tương đối – tức là chỉ ràng buộc chính các chủ thể đã tham gia quan hệ nghĩa vụ đó. Nhưng khi nói về vật quyền là nói về quyền năng của một chủ thể trên một vật, có hiệu lực tuyệt đối – tức là làm phát sinh hiệu lực đối kháng với tất cả các chủ thể khác trong xã hội (erga omnes) và ngăn cấm mọi chủ thể khác thực hiện quyền năng tương tự với vật đó[25]. Do vật, quyền làm phát sinh quyền loại trừ như vậy, nên về nguyên lý, luật tài sản phải (i) ghi nhận minh thị số lượng, nội dung cụ thể và đối tượng của các vật quyền; và (ii) có cơ chế thông báo công khai cho mọi chủ thể biết về sự tồn tại và nội dung của các vật quyền lên một vật nhất định.
Theo Sjef van Erp, hai nguyên lý kể trên đồng thời tương ứng với hai nguyên tắc phổ quát của luật tài sản, được thừa nhận trong nhiều nền tài phán khác nhau: nguyên tắc luật định vật quyền (numerous clausus) công khai hoá vật quyền (transparency)[26].
Để bảo đảm nguyên tắc luật địnhvật quyền, vật là đối tượng của vật quyền phải được xác định rõ bởi luật[27]. Ban đầu, luật tài sản chỉ ghi nhận các đối tượng là vật hữu hình, bao gồm bất động sản (như đất đai) và động sản. Tuy nhiên, do sự phát triển của xã hội,danh sách các đối tượng của quyền tài sản ngày càng được mở rộng[28]. Luật tài sản bắt đầu ghi nhận các đối tượng phức tạp hơn như vật vô hình (như quyền đòi nợ), cho phép chúng được chuyển nhượng và sử dụng làm tài sản bảo đảm. Gần đây, những thảo luận về việc mở rộng phạm vi đối tượng của luật tài sản để bao gồm cả tài sản ảo (virtual property), tài sản mã hoá (cryptoasset)… xuất hiện ngày càng nhiều[29]. Như vậy, thực tiễn cho thấy sự phát triển của nền kinh tế xã hội luôn đặt ra nhu cầu mới đối với việc cải cách luật tài sản để dung nạp các đối tượng mới phát sinh. Tuy nhiên, việc thừa nhận đối tượng mới của luật tài sản cần tiến hành rất thận trọng và phải đặt trong tương quan với chính sách pháp lý khác nhiều khi nằm ngoài phạm vi luật tài sản.
Đối với nguyên tắc thứ hai là công khai hoá (transparency), nguyên tắc này yêu cầu đối tượng của luật tài sản phải có tính xác định (specificity) và các vật quyền lên đối tượng đó phải được công khai thông qua các cơ chế của luật tài sản. Tính xác định là khả năng một vật có thể được khu biệt hoá, để xác định được ranh giới chính xác giữa vật đó tách biệt với những thứ khác xung quanh[30]. Nếu không xác định được, vật đó không thể là đối tượng của các quyền nói chung và quyền tài sản nói riêng. Sau khi đủ tính xác định, các vật quyền lên đối tượng đó sẽ được công khai thông qua các cơ chế như đăng ký (đối với bất động sản), hoặc chiếm hữu vật lý và chiếm hữu pháp lý (với động sản) để mọi chủ thể đều biết được có bao nhiêu vật quyền đang được áp dụng lên một vật và không xâm phạm các vật quyền đó[31].
Soi chiếu những đặc tính phức tạp của dữ liệu dưới các nguyên tắc kể trên, việc xây dựng quy chế quyền tài sản cho dữ liệu phải đối mặt với nhiều thách thức về kỹ thuật và chính sách pháp lý; trong đó điển hình nhất là các thách thức về tính xác định của dữ liệu và về yêu cầu luật định quyền tài sản đối với dữ liệu.        
2.2. Về tính xác định của dữ liệu
Thứ nhất, dữ liệu không bị cạn kiệt (non-depletable). Khi một người sử dụng dữ liệu, chẳng hạn như quan sát dữ liệu rồi khái quát thông tin từ dữ liệu đó, thì dữ liệu không bị mất đi hay giảm sút về chất lượng[32]. Điều này khiến dữ liệu trở nên “vô hạn” và khác biệt với nhiều tài sản khác, bởi hầu hết các tài sản hữu hình đều cạn kiệt sau khi sử dụng, còn tài sản vô hình thì sẽ mất giá trị nếu ai cũng có thể sử dụng chúng (chẳng hạn như độc quyền khai thác nhãn hiệu). Tuy nhiên, có ý kiến khác lại cho rằng, do phụ thuộc vào vật chứa đựng dữ liệu (“vật chứa đựng”), chẳng hạn như phiến đá, hay bộ nhớ của máy tính, nếu vật chứa đựng mà không tồn tại được thì dữ liệu đó cũng sẽ mất đi[33]. Do đó, có thể nói rằng dữ liệu hoàn toàn có giới hạn, có thể bị cạn kiệt bởi tuổi thọ của chúng chính là số lần sử dụng còn lại của vật chứa đựng.
Thứ hai, dữ liệu có tínhdễ sao chép (easy to be duplicated)[34]. Trước đây, khi các công nghệ như máy ảnh và máy tính chưa xuất hiện, việc sao chép dữ liệu từ một vật chứa đựng sang vật chứa đựng khác (như chép nội dung cuốn sách sang một tờ giấy) diễn ra rất phức tạp, mất thời gian và thường không đầy đủ, hoàn mỹ. Tuy nhiên, nhờ có công nghệ mới, hoặc với các dữ liệu số thì việc sao chép dữ liệu giữa hai vật chứa đựng diễn ra rất nhanh chóng và gần như toàn mỹ. Thế nên, có ý kiến cho rằng một dữ liệu có thể xuất hiện ở nhiều nơi khác nhau, trên nhiều vật chứa đựng khác nhau trong cùng một thời điểm, cho phép nhiều người cùng truy cập và khai thác[35]. Vì vậy, dữ liệu giống tài nguyên công cộng (public goods) như không khí hay nước biển, do ai cũng có thể chiểm hữu chúng với số lượng lớn, giá rẻ, dễ tái tạo,[36] và vì thế không thể là tài sản.
Tuy nhiên, việc dữ liệu dễ sao chép không có nghĩa là chúng không có tính xác định. Dữ liệu gốc luôn phải nằm tại một nơi nhất định trên một vật chứa đựng nhất định. Dữ liệu số là gốc cũng phải nằm ở một máy chủ tại một nơi nhất định trước khi được đưa lên mạng để nhiều người có thể cùng truy cập. Nếu nhiều người cùng lúc truy cập, dữ liệu gốc (D0) tại máy chủ sẽ được sao chép thành nhiều bản sao (D1, D2, D3) gửi đến các máy tính đang truy cập và được lưu nhất thời vào bộ nhớ của máy tính đó hoặc trí não con người. Như thế, có thể thấy rõ dữ liệu gốc (D0) tại máy chủ và các bản sao (D1, D2, D3) là các vật khác nhau, và mỗi người truy cập sẽ chiếm hữu một bản sao (D1, hoặc D2, D3) chứ không phải là dữ liệu gốc (D0). Như vậy, tính xác định của bản gốc sẽ không bị ảnh hưởng dù có nhiều bản sao tại nhiều vật chứa đựng khác nhau.
Thứ ba, nhiều học giả khác tin rằng dữ liệu là vô hình (intangible),[37]bởi mặc dù dữ liệu có một số khía cạnh hữu hình (như có liên kết chặt chẽ với vật chứa đựng) dữ liệu có bản chất rất khác với các loại tài sản hữu hình, không thực sự cầm, nắm, sờ được chúng mà chỉ có thể tác động vào vật chứa đựng chúng mà thôi. Do đó, không nên xem xét xây dựng quyền sở hữu hoặc chiếm hữu đối với dữ liệu, bởi việc xây dựng này dựa trên giả định sai trái rằng chính dữ liệu đã có tính hữu hình[38]. Tuy nhiên, nhiều học giả khác phản đối rằng sự phụ thuộc vào vật chứa đựng của dữ liệu đủ để khiến chúng trở nên hữu hình,[39] và vì thế hoàn toàn có thể chiếm hữu được[40]. Toà tối cao bang New York trong vụ Shmueli nổi tiếng cũng có cách hiểu gần gũi như vậy, khi cho rằng dữ liệu có thể là đối tượng của hành vi định đoạt trái phép “tài sản” của người khác, là căn cứ làm phát sinh trách nhiệm bồi thường thiệt hại ngoài hợp đồng (tort conversion), một chế định mà thông thường chỉ áp dụng cho tài sản hữu hình mà thôi[41].            
Thậm chí nếu dữ liệu là vô hình, dữ liệu vẫn đủ tính xác định và không phải là ý tưởng trừu tượng (mysticum)[42]. Về cơ bản, một ý tưởng trừu tượng là gần như không thể sở hữu được, bởi không thể xác định được ranh giới hay phạm vi của chúng. Chỉ có thể bảo hộ được nếu các ý tưởng trừu tượng đó được ghi nhận thành một hình thức nhất định (chẳng hạn như bài hát được ghi lại thành tệp âm thanh), bởi nếu không được ghi lại thì không thể làm rõ phạm vi hay giới hạn của đối tượng được bảo hộ. Do đó, bảo hộ quyền sở hữu trí tuệ không phải là bảo hộ cho ý tưởng mà chỉ là bảo hộ một độc quyền sao chép một bản ghi hoặc độc quyền ghi lại ý tưởng đó vào một hình thức vật lý (mechanicum) mà thôi. Dữ liệu không đến mức trừu tượng như ý tưởng /thông tin, bởi chúng phải neo vào và bị giới hạn bởi vật chứa đựng. Đồng thời, vì có bản chất là các dấu hiệu, nên chắc chắn con người sẽ nhận thức được chúng thông qua các giác quan.   
Vậy làm sao để làm rõ tính xác định của một dữ liệu bất kỳ? Cách thứ nhất là dựa vào vật chứa đựng: chỉ cần xác định là dữ liệu đó đang nằm trong vật chứa đựng nào, ở đâu, kích thước, số lượng bao nhiêu, thì giới hạn của dữ liệu cũng sẽ tương ứng với giới hạn của vật chứa đựng đó[43]. Chẳng hạn, dữ liệu trong một phần cứng (ví dụ USB) được giới hạn trong chính phần cứng đó, bảo đảm đủ tính xác định để phân biệt chúng với các thứ khác. Cách tiếp cận này được coi là sự phát triển của nguyên tắc dung hợp (merger rule) trong việc xác định các hành vi xâm phạm tài sản trái phép (conversion). Như đã phân tích ở trên, thông thường cách hành vi này chỉ có đối tượng là vật hữu hình, nhưng càng về sau thì chế định này cũng xem xét quy định cả các loại vật vô hình mà được ghi nhận dưới dạng vật lý (như chứng quyền, giấy ghi nợ, sổ cái…). Có thể coi đây là “hữu hình hoá” các quyền vô hình thông qua dạng thức vật lý của chúng (giấy tờ ghi nhận), tức là ai sở hữu giấy tờ ghi nhận quyền sẽ tương ứng nắm quyền vô hình trên giấy tờ đó[44]. Như vậy, dù dữ liệu vô hình hay hữu hình cũng không còn quan trọng, mà điều quan trọng là dữ liệu đó được chứa trong vật chứa đựng nào mà thôi. Toà án tối cao liên bang Đức cũng thừa nhận một phần cách hiểu này trong hai quyết định của mình[45]. Các cách khác bao gồm: dựa trên nội dung của dữ liệu đó (về sự vật, sự việc nào), dựa trên người tạo ra dữ liệu (cá nhân, pháp nhân, tổ chức) và mục đích và việc sử dụng dữ liệu tương ứng (mục đích cá nhân, phân phối công khai, mục đích thương mại v.v..)[46]. Có thể thấy những cách xác định này không hoàn toàn mới, mà phần nào thừa hưởng cách tiếp cận để bảo hộ quyền sở hữu trí tuệ trước đây.
2.3. Về yêu cầu luật định quyền tài sản đối với dữ liệu
Trong trường hợp đủ tính xác định, dữ liệu vẫn cần phải bảo đảm tính luật định, tức là được luật tài sản ghi nhận là một đối tượng của luật tài sản. Không phải luật tài sản chưa bao giờ quan tâm đến dữ liệu: pháp luật về quyền sở hữu trí tuệ có quy định về quyền tác giả với sưu tập dữ liệu (database right), thông tin bí mật (confidential information) và bí mật kinh doanh (trade secret), thậm chí quy định về sáng chế đều có liên quan và phần nào có thể được sử dụng cho dữ liệu. Tuy nhiên, với mục đích bảo hộ cho các sản phẩm sáng tạo, các quyền tài sản này nếu có áp dụng thì cũng chỉ có phạm vi đối tượng tương đối hạn chế và khó bao hàm được toàn bộ các loại dữ liệu[47]. Cùng với đó, để có thể trở thành đối tượng của luật tài sản thì dữ liệu không thể đồng thời là đối tượng của các quyền nhân thân tuyệt đối không thể chuyển giao hoặc bị cấm chuyển giao[48]. Giới hạn này được đặt ra bởi một số quyền nhân thân tuyệt đối có liên quan đến dữ liệu cá nhân, thông tin riêng tư thường được coi là “bất khả xâm phạm”,[49] và phải được ưu tiên hơn các quyền tài sản. Tương tự như tranh luận trước đây về việc có nên ghi nhận quyền sở hữu với bộ phận cơ thể người,[50] không phải vật gì có giá trị cũng nên được coi là đối tượng của các quyền tài sản. Một dữ liệu nhất định nếu được coi là đối tượng của quyền nhân thân tuyệt đối như quyền với dữ liệu cá nhân hoặc quyền riêng tư, thì khó có thể đồng thời là đối tượng của luật tài sản. Điều này là bởi, nếu một người (A) bán được dữ liệu cá nhân của chính mình, luật tài sản sẽ cho phép chủ sở hữu mới (B) quyền ngăn cấm mọi chủ thể tác động lên dữ liệu đó, ảnh hưởng và làm mất hiệu lực của quyền riêng tư và quyền với dữ liệu cá nhân của chính chủ thể dữ liệu là người (A) ban đầu.
Vấn đề kể trên có lẽ không chỉ là câu hỏi pháp lý thuần tuý mà còn là câu hỏi chính sách pháp lý phức tạp. Nhiều ý kiến cho rằng việc coi dữ liệu là tài sản dễ tạo ra sự độc quyền về thông tin và ý tưởng,[51] dẫn tới những hạn chế với quyền tự do ngôn luận, quyền riêng tư, đồng thời ngăn cản sự sáng tạo và phát triển của công nghệ nói chung[52]. Tuy nhiên, có ý kiến cho rằng, không nên cực đoan hoá rằng dữ liệu chỉ có thể là đối tượng của một trong hai quyền: nhân thân hoặc tài sản mà nên cân đối hợp lý các lợi ích chính đáng này[53]. Kể cả nếu ưu tiên các quyền nhân thân tuyệt đối, cần làm rõ phạm vi điều chỉnh của các quyền này để xác định được dữ liệu nào nằm ngoài phạm vi đó và có thể trở thành đối tượng của luật tài sản. Đồng thời, cần có thêm những nghiên cứu đa ngành để xác định đâu là điểm cân bằng phù hợp giữa lợi ích nhân thân và các lợi ích tài sản của các cá nhân và cả xã hội trong mối quan hệ với dữ liệu.
3. Kết luận
Khoa học pháp lý đến nay vẫn chưa thống nhất được một nhận thức chung về phạm vi, khái niệm và các tính chất căn bản của dữ liệu, nhất là sự phân loại các dữ liệu cá nhân và dữ liệu phi cá nhân. Về cơ bản, các nền tài phán hiện nay vẫn đang lựa chọn cách tiếp cận chờ đợi và quan sát (wait-and-see approach) khi xây dựng các quy chế pháp lý cho dữ liệu, nhất là việc đề ra các quy chế tài sản đối với dữ liệu. Bất kể sự đa dạng trong các cách tiếp cận hiện nay về dữ liệu, thì không thể phủ nhận được giá trị kinh tế của dữ liệu: Dữ liệu đã và đang có vai trò to lớn trong xã hội, tác động mạnh mẽ tới sự phát triển của nhiều lĩnh vực sử dụng dữ liệu nói riêng và sự phát triển chung của nền kinh tế số. Mặc dù vậy, việc nhấn mạnh nhu cầu khai thác dữ liệu không đương nhiên dẫn tới quan niệm cho phép dữ liệu được hưởng quy chế tài sản ngay lập tức, mà phải đáp ứng yêu cầu của nguyên lý nền tảng của luật tài sản. Về nguyên tắc, quy chế tài sản hoá dữ liệu phải được xây dựng và vận hành dựa trên cơ sở bảo đảm được tính xác định của dữ liệu và tính luật định đối với quy tắc quyền tài sản.
Bên cạnh đó, việc xây dựng quy chế tài sản với dữ liệu cũng có khả năng xung đột với các quyền nhân thân tuyệt đối, các quyền tài sản hiện hành lên dữ liệu, cũng như đặt ra những lo ngại về các tác dụng phụ tới việc thực hiện các quyền tự do và sự phát triển chung của xã hội. Vì vậy, trong tương lai, cần thêm nhiều các nghiên cứu liên ngành để xác định cách tiếp cận phù hợp nhất khi xây dựng quy chế tài sản hoá dữ liệu để tối ưu hoá lợi ích từ đối tượng mới và đầy hứa hẹn này./.

 


[1] Từ điển Oxford Online, "Data", https://www.oxfordlearnersdictionaries.com/definition/english/data, truy cập ngày 13/04/2023.
[2] Australian Bureau of Statistics, “Statistical Language - What are Data?”, Official website, 13/08/2022, truy cập tại https://www.abs.gov.au/websitedbs/D3310114.nsf/Home/Statistical+Language+-+what+are+data.
[3] Economic Commission for Europe of the United Nations (UNECE), "Terminology on Statistical Metadata", Conference of European Statisticians Statistical Standards and Studies, No. 53, Geneva, 2000
[4] OECD, “Glossary of Statistical Term”, Statistic Portal, 13/08/2022 https://stats.oecd.org/glossary/detail.asp?ID=532.
[5] Martin Frické, “The knowledge pyramid: A critique of the DIKW hierarchy”, Journal of Information Science (35: 131-142).
[6] Beynon and Davies, “Database System”, Palgrave MacMillan, 2003, 20.
[7] John Sowa, “Conceptual Structures: Information Processing in Mind and Machine”, The Systems Programming Series Book, VivoMind Resarch, January 1984. Beynon and Davies, “Database System”, Palgrave MacMillan, 2003, 23.
[8] Do việc đưa các “dấu hiệu” đó thông qua các bộ lọc ở trên có thể được tiến hành rất nhanh trong tâm trí của chủ thể (chẳng hạn trong não người) trong vòng chưa đầy một giây, việc xác định rõ ràng từng bước như vậy là rất khó khăn. Tuy nhiên, do nhu cầu phải bóc tách các công đoạn trong quy trình khai thác Dữ liệu lớn (Big Data) và dạy Trí tuệ nhân tạo (AI), các phân tích kể trên về dữ liệu và các tầng dữ liệu được tập trung nghiên cứu làm rõ và trở nên phổ biến hơn.
[9] Lothar Determann, “No one owns data”, Hasting Law Journal, Vol 70:1, p 6.
[10] GDPR là viết tắt của General Data Protection Regulation - Quy định chung về bảo mật thông tin.
[11] Theo Điều 4 GDPR: ‘Personal data’ means any information relating to an identified or identifiable natural person (‘data subject’); an identifiable natural person is one who can be identified, directly or indirectly, in particular by reference to an identifier.
[12] Jeffrey Ritter và Anna Mayer, “Regulating data as property: A new construct for moving forward”, Duke Law & Technology Review, (Vol 16), 272, 224.
[13] Joint Research Centre, European Commission in-house service, “The economics of ownership, access and trade in digital data”, JRC Digital Economy Working Paper 2017-01, 6-8.
[14] Uỷ ban Châu Âu, “Towards a thriving data-driven economy”, SWD (2014) 214 final, Brussels, 2/7/2014, 4.
[15] Václav Janecek, “Ownership of personal data in the Internet of Things”, Computer Law & Security Review 34 (2018) 1039–1052, 1042.
[16] Sjef van Erp, “Ownership of Data and the Numerus Clausus of Legal Objects”, Maastricht European Private Law Institute Working Paper No. 2017/6, 10.
[17] Cách lấy ví dụ này tham khảo tại Luciano Floridi, ‘Is Semantic Information Meaningful Data?’, 70 Philosophy and Phenomenological Research (2005) 351, 359.
[18] Sự phân biệt này rất quan trọng, bởi lẽ nhiều tranh luận liên quan đến dữ liệu chưa phản ánh nhận thức rõ nét về sự khác nhau giữa “dữ liệu” và “thông tin”. Thay vì đặt ra vấn đề có hay không nên tài sản hoá “dữ liệu”, các tranh luận này lại tập trung vào việc phân tích liệu có nên tài sản hoá hoặc độc quyền sở hữu “thông tin”. Với việc “thông tin” hay “ý tưởng”, “ý nghĩ” là một “thứ” vô hình và gần như không thể xác định được phạm vi, các tranh luận về tài sản hoá một “thứ” trừu tượng như “thông tin” là không cần thiết và không hữu dụng.
[19] Điều 4 GDPR.
[20] Article 2, Article 4(1) và (5), Recitals (14), (15), (26), (27), (29) và (30) GDPR.
[21] Jeffrey Ritter và Anna Mayer, “Regulating data as property: A new construct for moving forward”, Duke Law & Technology Review, (Vol 16), 272, 225.
[22] Václav Janecek, “Ownership of personal data in the Internet of Things”, Computer Law & Security Review 34 (2018) 1039–1052, 1043.
[23] European Commission Communication, ‘Building a European Data Economy’, COM (2017) 9 final, 10/1/2017, 9.
[24] Luciano Floridi, ‘Is Semantic Information Meaningful Data?’, 70 Philosophy and Phenomenological Research (2005) 351, 354-359.
[25] Ngô Huy Cương, “Tổng quan về Luật tài sản”, Tạp chí Khoa học Đại học Quốc gia Hà Nội (ĐHQGHN), Kinh tế - Luật, T.XIX, số 3, 2003, tr.43.
[26] Sjef van Erp, “Ownership of Data and the Numerus Clausus of Legal Objects”, Maastricht European Private Law Institute Working Paper No. 2017/6, 8-12.
[27] Huỳnh Thiên Tứ, “Vật quyền dữ liệu số”, Tạp chí Nghiên cứu Lập pháp số 14 (462), tháng 7/2022.
[28] Ngô Huy Cương, tlđd, tr. 42-47.
[29] Đỗ Giang Nam, Đào Trọng Khôi, “Bàn thêm về bản chất pháp lý của “tiền ảo” dưới góc nhìn của luật tài sản so sánh”, Tạp chí Khoa học ĐHQGHN – Luật học, 37(4), tr. 68-80
[30] Sjef van Erp và Bram Akkermans, “Cases, Materials and Texts on Property Law”, Hart 2012, 76.
[31] Sjef van Erp, “Ownership of Data and the Numerus Clausus of Legal Objects”, Maastricht European Private Law Institute Working Paper No. 2017/6, 12.
[32] Patrik Hummel, Matthias Braun, Peter Dabrock, “Own Data? Ethical Reflections on Data Ownership”, Philosophy & Technology, 13 September 2019, 4.
[33] Barbara Prainsack, “Logged out: Ownership, exclusion and public value in the digital data and information commons”, Big Data & Society, 6(1), 2019, 5.
[34] Herbert Zech, “Information als Schutzgegenstand”, Mohr Siebeck, 2012, 117-119.
[35] Patrik Hummel, Matthias Braun, Peter Dabrock, “Own Data? Ethical Reflections on Data Ownership”, Philosophy & Technology, 13 September 2019, 202.
[36] Nadezhda Nickolayevna Purtova, “Property rights in personal data: A European perspective”, PhD Thesis, BOXPress BV, 2011, 101. Hal Varian, ‘Markets for Information Goods’, University of California, Berkeley, April 1998 (revised: October 16, 1998), truy cập tại <http://people.ischool.berkeley.edu/∼hal/ Papers/japan/>. Josef Drexl, “Data Access and Control in the Era of Connected Devices”, Report, European Consumer Organisation, BEUC-X-2018-111, 30.
[37] Lothar Determann, “No one owns data”, Hasting Law Journal, Vol 70:1, 41. Francesco Banterle, “Data Ownership in the Data Economy: A European Dilemma”, EU Internet Law in the Digital Era (pp.199-225), Chapter: 9, Springer, 8. Herbert Zech, “Data as a Tradable Commodity” trong De Franceschi, “European Contract Law and the Digital Single Market”, 2016, 59-60.
[38] Lothar Determann, “No one owns data”, Hasting Law Journal, Vol 70:1, 1.
[39] Ritter và Mayer, 260.
[40] David Harvey, “Collissions in the Digital Paradigm”, Hart Publishing, 2017, 151.
[41] Shmueli v. Corcoran Group, Supreme Court of the State of New York County of New York: IAS Part 49, 9 Misc.3d 589, 2005. Thyroff v. Nationwide Mutual Insurance Company, 8 N.Y.3d 283, 292-93, 2007.
[42] Eric Tjong Tjin Tai, “Data ownership and consumer protection”, Tilburg Private Law Working Paper Series No. 09/2017, 4.
[43] Jeffrey Ritter và Anna Mayer, “Regulating data as property: A new construct for moving forward”, Duke Law & Technology Review, (Vol 16), 272, 264.
[44] Eric Tjong Tjin Tai, “Data ownership and consumer protection”, Tilburg Private Law Working Paper Series No. 09/2017, 8.
[45] German Bundesgerichtshof (Federal Supreme Court), Decision dated 15/11/2006 (ownership of software on a CD-ROM). German Bundesgerichtshof (Federal Supreme Court), Decision 10/07/2015 (audio recordings on a tape).
[46] Sjef van Erp, “Ownership of Data and the Numerus Clausus of Legal Objects”, Maastricht European Private Law Institute Working Paper No. 2017/6, 20.
[47] Francesco Banterle, “Data Ownership in the Data Economy: A European Dilemma”, EU Internet Law in the Digital Era (pp.199-225), Chapter: 9, Springer, 6-8.
[48] Nguyễn Ngọc Điện, “Giáo trình Luật dân sự 1 (Tập 1)”, NXB Trường Đại học Mở TPHCM, 2019, 226.
[49] Huỳnh Thiên Tứ, “Vật quyền dữ liệu số”, Tạp chí Nghiên cứu Lập pháp số 14 (462), tháng 7/2022.
[50] Xem thêm tại: Carlo Petrini, “Ethical and legal considerations regarding the ownership and commercial use of human biological materials and their derivatives”, J Blood Med. 2012; 3: 87–96. 
[51] Daniel Zimmer, ‘Property Rights Regarding Data’, Lohsse, Schulze & Staudenmayer, 2017.
[52] Lothar Determann, ‘No One Owns Data’, Hastings Law Review 70 (2018), 1–44, 34-39.
[53]Jeffrey Ritter và Anna Mayer, “Regulating data as property: A new construct for moving forward”, Duke Law & Technology Review, (Vol 16), 272.

(Nguồn tin: Bài viết được đăng tải trên Ấn phẩm Tạp chí Nghiên cứu Lập pháp số 09 (481), tháng 05/2023.)


Thống kê truy cập

32967214

Tổng truy cập