Các cấp độ và kỹ thuật mô hình hóa dữ liệu

Bài viết này giới thiệu cho bạn về mô hình hóa dữ liệu và các loại mô hình dữ liệu khác nhau. Các mô hình dữ liệu giúp giữ cho dữ liệu nhất quán và cho phép mọi người vạch ra cách tổ chức dữ liệu. Hiểu biết cơ bản giúp các nhà phân tích và các bên liên quan khác dễ dàng hiểu được dữ liệu của họ và sử dụng dữ liệu đó theo đúng cách.

Bài viết này giới thiệu cho bạn về mô hình hóa dữ liệu và các loại mô hình dữ liệu khác nhau. Các mô hình dữ liệu giúp giữ cho dữ liệu nhất quán và cho phép mọi người vạch ra cách tổ chức dữ liệu. Hiểu biết cơ bản giúp các nhà phân tích và các bên liên quan khác dễ dàng hiểu được dữ liệu của họ và sử dụng dữ liệu đó theo đúng cách.

Lưu ý quan trọng: Nếu là một nhà phân tích dữ liệu mới vào nghề, bạn sẽ không được yêu cầu thiết kế mô hình dữ liệu. Nhưng bạn có thể bắt gặp các mô hình dữ liệu hiện có mà tổ chức của bạn đã có sẵn.

Mô hình hóa dữ liệu là gì?

Mô hình hóa dữ liệu là quá trình tạo sơ đồ thể hiện trực quan cách tổ chức và cấu trúc dữ liệu. Những biểu diễn trực quan này được gọi là mô hình dữ liệu. Bạn có thể coi mô hình dữ liệu như một bản thiết kế của một ngôi nhà. Tại bất kỳ thời điểm nào, có thể có thợ điện, thợ mộc và thợ sửa ống nước sử dụng bản thiết kế đó. Mỗi người trong số những người thợ xây dựng này có mối quan hệ khác nhau với bản thiết kế, nhưng tất cả họ đều cần nó để hiểu cấu trúc tổng thể của ngôi nhà. Các mô hình dữ liệu cũng tương tự; những người dùng khác nhau có thể có các nhu cầu dữ liệu khác nhau, nhưng mô hình dữ liệu mang lại cho họ sự hiểu biết về toàn bộ cấu trúc.

Các cấp độ mô hình hóa dữ liệu

Mỗi cấp độ mô hình hóa dữ liệu có một mức độ chi tiết khác nhau.

kim tự tháp với ba loại mô hình hóa dữ liệu phổ biến: khái niệm, logic và vật lý

Mô hình hóa dữ liệu khái niệm cung cấp chế độ xem ở mức cao về cấu trúc dữ liệu, chẳng hạn như cách dữ liệu tương tác trong một tổ chức. Ví dụ, một mô hình dữ liệu khái niệm có thể được sử dụng để xác định các yêu cầu kinh doanh cho một cơ sở dữ liệu mới. Một mô hình dữ liệu khái niệm không chứa các chi tiết kỹ thuật.

Mô hình hóa dữ liệu logic tập trung vào các chi tiết kỹ thuật của cơ sở dữ liệu như mối quan hệ, thuộc tính và thực thể. Ví dụ: một mô hình dữ liệu logic xác định cách các bản ghi riêng lẻ được xác định duy nhất trong cơ sở dữ liệu. Nhưng nó không đánh vần tên thực của các bảng cơ sở dữ liệu. Đó là công việc của một mô hình dữ liệu vật lý.

Mô hình hóa dữ liệu vật lý mô tả cách cơ sở dữ liệu hoạt động. Một mô hình dữ liệu vật lý xác định tất cả các thực thể và thuộc tính được sử dụng; ví dụ, nó bao gồm tên bảng, tên cột và kiểu dữ liệu cho cơ sở dữ liệu.

Thông tin thêm có thể được tìm thấy trong phần so sánh các mô hình dữ liệu này.

Kỹ thuật mô hình hóa dữ liệu

Có rất nhiều cách tiếp cận khi phát triển mô hình dữ liệu, nhưng hai phương pháp phổ biến là Sơ đồ mối quan hệ thực thể (Entity Relationship Diagram ERD) và sơ đồ Ngôn ngữ mô hình hóa thống nhất (Unified Modeling Language – UML). ERD là một cách trực quan để hiểu mối quan hệ giữa các thực thể trong mô hình dữ liệu. Sơ đồ UML là những sơ đồ rất chi tiết mô tả cấu trúc của một hệ thống bằng cách hiển thị các thực thể, thuộc tính, hoạt động của hệ thống và các mối quan hệ của chúng. Nếu là một nhà phân tích dữ liệu mới vào nghề, bạn cần hiểu rằng có nhiều kỹ thuật lập mô hình dữ liệu khác nhau, nhưng trên thực tế, có thể bạn sẽ sử dụng kỹ thuật hiện có của tổ chức mình.

Bạn có thể đọc thêm về ERD, UML và từ điển dữ liệu trong bài viết về kỹ thuật lập mô hình dữ liệu này.

Phân tích dữ liệu và mô hình hóa dữ liệu

Mô hình hóa dữ liệu có thể giúp bạn khám phá các chi tiết ở mức độ cao về dữ liệu của mình và cách dữ liệu đó có liên quan trên các hệ thống thông tin của tổ chức. Mô hình hóa dữ liệu đôi khi yêu cầu phân tích dữ liệu để hiểu cách dữ liệu được kết hợp với nhau; theo cách đó, bạn biết cách lập bản đồ dữ liệu. Và cuối cùng, các mô hình dữ liệu giúp mọi người trong tổ chức của bạn hiểu và cộng tác với bạn trên dữ liệu của bạn dễ dàng hơn. Điều này rất quan trọng đối với bạn và mọi người trong nhóm của bạn!

Chuyển đổi số đang làm trầm trọng thêm bất bình đẳng xã hội như thế nào

Một góc nhìn về bất bình đẳng kỹ thuật số, dẫn đến bất bình đẳng xã hội của GS Alexander van Deursen, ĐH Twente, Hà Lan. Qua những câu chuyện, ví dụ chúng ta có thể thấy chúng ta ở đâu đó, vào lúc nào đó cũng như vậy.

Bài gốc trên website của ĐH Twente, Hà Lan.

Chúng ta sống trong một thế giới mà hầu hết mọi người đều trực tuyến. Internet là nguồn thông tin gần như vô tận, là không gian để chúng ta giữ liên lạc với những người thân yêu và là nơi chúng ta làm việc và tiêu dùng. Nhưng nếu bạn không có quyền truy cập internet, vì thiếu động lực, thiếu kỹ năng hoặc không có máy tính thì sao? Bất bình đẳng kỹ thuật số làm tăng khoảng cách xã hội giữa mọi người và thậm chí có thể dẫn đến sự loại trừ ai đó. Alexander van Deursen, giáo sư khoa học truyền thông tại Đại học Twente, Hà Lan đang nghiên cứu nguyên nhân phát sinh bất bình đẳng kỹ thuật số và cách chúng ta có thể chống lại nó.

Tác giả: Roel van der Heijden

Kim sử dụng Internet như một tạp chí hào nhoáng vô tận, nơi cô có thể tìm thấy câu trả lời cho mọi câu hỏi của mình về sức khỏe và các mối quan hệ. Điều đó khiến cô cảm thấy tự tin hơn. Willem dành vài giờ mỗi ngày trên YouTube và Facebook, nơi anh cảm thấy được lắng nghe bởi những người cùng tư tưởng, chí hướng. Anh ấy có thể đối phó với sự thất vọng của mình, nếu nó phát sinh, theo cách đó. Amina có một chiếc máy tính bảng mà các con của cô ấy có thể sử dụng để tra cứu thông tin. Bằng cách đó, bọn trẻ theo kịp việc học tại trường trường và học nhanh hơn.

Tuy nhiên, với tất cả những gì đang đọc, Kim cũng luôn tìm kiếm chế độ ăn kiêng phù hợp mà cô ấy không thể tìm thấy. Willem bắt đầu tin vào các thuyết âm mưu và ngày càng vướng vào ảo tưởng của chính mình. Trong cuộc khủng hoảng vi-rút corona, một máy tính bảng được chứng minh là không đủ cho ba đứa con của Amina. Các con của cô hiện đã bị tụt lại phía sau ở trường học.

Công nghệ mới có thể có những tác động tích cực cũng như tiêu cực. Làm thế nào để bạn ngăn chặn các khía cạnh tiêu cực có thể chiếm thế thượng phong? Ngoài ra, làm thế nào để bạn tránh được những yếu tố tiêu cực chủ yếu ảnh hưởng đến một nhóm người cụ thể trong xã hội? Các ví dụ trên được lấy từ bài giảng mở đầu của GS Alexander van Deursen với tựa đề ‘Nghịch lý bao trùm kỹ thuật số’ vào ngày 13/4/2023. Giáo sư Alexander van Deursen giữ ghế chủ tịch ‘Bất bình đẳng kỹ thuật số’ trong Bộ môn khoa học truyền thông tại Khoa Khoa học Hành vi, Quản lý và Xã hội của Đại học Twente. Ông là người sáng lập và giám đốc của Trung tâm Hòa nhập Kỹ thuật số tại khoa này. 

Các ví dụ minh họa những hệ quả sâu rộng của quá trình chuyển đổi số. Nắm vững các kỹ năng kỹ thuật số hiện là một phần thiết yếu trong cuộc sống hàng ngày của chúng ta. Điều đó không chỉ bao gồm các kỹ năng cơ bản để vận hành máy tính. Điều quan trọng không kém là mọi người sử dụng công nghệ một cách có trách nhiệm và họ có thể cảm nhận được những cạm bẫy. Nghiên cứu của GS Van Deursen tập trung vào nguyên nhân và hậu quả của bất bình đẳng kỹ thuật số, thường xuất phát từ vị trí của một cá nhân trong xã hội và các nguồn tài nguyên mà họ có quyền truy cập. Trình độ học vấn, thu nhập, sức khỏe, trình độ biết chữ hoặc mạng lưới xã hội là những ví dụ về các yếu tố tác động.

CHATGPT

Phạm vi và chiều sâu của các khả năng kỹ thuật số đang gia tăng nhanh chóng. Để chứng minh điều này, GS Van Deursen đã nhờ ChatGPT, một mô hình ngôn ngữ tiên tiến sử dụng trí tuệ nhân tạo để tạo ra văn bản trôi chảy theo yêu cầu, viết bài giảng mở đầu cho ông. Kết quả là tuyệt vời, ông cho biết. Mặc dù những công nghệ mới như vậy mang lại nhiều cơ hội, nhưng ngày càng có một nhóm nhỏ người được định vị để gặt hái những lợi ích. “Những thành viên thiệt thòi trong xã hội được hưởng lợi tương đối ít hơn từ những phát triển này, đồng thời, họ cũng là những người có nhiều khả năng bị ảnh hưởng bởi những trải nghiệm tiêu cực.”

Alexander van Deursen

Những thành viên thiệt thòi trong xã hội được hưởng lợi tương đối ít hơn từ những phát triển này, đồng thời, họ cũng là những người có nhiều khả năng bị ảnh hưởng bởi những trải nghiệm tiêu cực.

– Alexander van Deursen.

Trong bài diễn văn mở đầu của mình, ông đưa ra một số ví dụ về những cạm bẫy kỹ thuật số, bao gồm sắp xếp theo thuật toán (vốn là cơ sở phát sinh vụ bê bối trợ cấp chăm sóc trẻ em ở Hà Lan), các hệ thống tín dụng đáng ngờ, phòng phản hồi trên mạng xã hội, vi phạm quyền riêng tư, nhưng cũng là chứng nghiện mạng xã hội, các vấn đề về khoảng chú ý và rối loạn nhân cách. “Những rủi ro là có thật, và những mối nguy hiểm đang gia tăng. Quy định pháp luật để khắc phục các khía cạnh tiêu cực của công nghệ thường đi sau thực tiễn.”

CÁC THIẾT BỊ THÔNG MINH, NHƯNG QUYẾT ĐỊNH KHÔNG SÁNG SUỐT

Chuyển đổi số tiếp tục len lỏi sâu hơn vào cuộc sống của chúng ta thông qua các thiết bị chúng ta sử dụng ở nhà, tại nơi làm việc và trên đường đi. Chúng ta có nhiều thiết bị thông minh như máy điều nhiệt, thiết bị đeo, tivi, lò nướng và thậm chí cả tất trẻ em. Hệ thống Internet of Things (internet vạn vật – IoTs) phức tạp đang phát triển nhanh chóng. Nó nhằm làm cho cuộc sống dễ dàng hơn, bền vững hơn hoặc an toàn hơn cho tất cả chúng ta và sẽ giúp chúng ta đưa ra quyết định đúng đắn, chẳng hạn như về sức khỏe hoặc tính bền vững. GS Van Deursen nói: “Tuy nhiên, nghiên cứu của chúng tôi chỉ ra rằng hệ thống này không cải thiện quá trình ra quyết định của nhiều người. “Mọi người cảm thấy khó đánh giá một quyết định được đưa ra bởi một hệ thống. Sử dụng các thiết bị thông minh thường không dẫn đến hành vi bền vững, mặc dù đó là ý định.”

CẦN NHIỀU HƠN LÀ CHỈ TẶNG LAPTOP

Chuyển đổi số thường được coi là một điều tốt cho tất cả mọi người. Tuy nhiên, những tác động tiêu cực cũng có thể lấn át những kết quả tích cực. GS Alexander van Deursen đưa ra thuật ngữ “nghịch lý bao trùm kỹ thuật số” (digital inclusion paradox).

Làm thế nào để chúng ta giải quyết điều này? GS Van Deursen nói rằng bất bình đẳng kỹ thuật số đang ngày càng được chú ý và nó chiếm vị trí cao trong chương trình nghị sự chính trị. “Nhiều sáng kiến ​​tập trung vào việc đưa mọi người lên mạng, từ việc tổ chức các khóa học đến phát máy tính xách tay. Ý tưởng là sau đó mọi thứ sẽ ổn khi mọi người có thể xử lý công nghệ. Nhưng việc sử dụng ngày càng trở nên quan trọng. Ví dụ: hiểu được rằng bạn không nên chia sẻ thông tin của mình với bất kỳ ai hoặc không phải tất cả tin tức trực tuyến đều là sự thật. Theo nghĩa đó, điều quan trọng không chỉ là phát huy những tác động tích cực mà còn phải tránh những hậu quả tiêu cực của công nghệ.”

TĂNG KHẢ NĂNG PHỤC HỒI

Làm cho mọi người trở nên ‘kiên cường kỹ thuật số’ nên bắt đầu từ trường học, tốt nhất là càng sớm càng tốt. Theo GS Van Deursen, người lớn cũng nên được đào tạo thông qua các khóa học hoặc lớp học cộng đồng hoặc thư viện chẳng hạn.

GS Van Deursen cho biết trách nhiệm đối với việc quy định liên quan sử dụng kỹ thuật số của chúng ta thuộc về chính phủ, nhưng cũng rõ ràng thuộc về các nhà sản xuất công nghệ. Ví dụ: lấy các điều khoản và điều kiện mà chúng tôi buộc phải hiểu để sử dụng một số thiết bị hoặc dịch vụ nhất định. “Nhiều người cảm thấy không thể đọc hết và hiểu ba mươi sáu trang ‘ngôn ngữ pháp lý’. Chúng ta thường chấp nhận điều này (coi nó không cần thiết). Tuy nhiên, do số lượng dữ liệu cá nhân được thu thập ngày càng tăng, chúng ta cần hiểu điều gì xảy ra với thông tin cá nhân và ai có thể truy cập thông tin cá nhân. Điều này rất quan trọng đối với quyền riêng tư, bảo mật và tự do của chúng ta. Theo nghĩa đó, việc hiểu các điều khoản và điều kiện sử dụng nên được quan tâm đúng mức.