Phân tích và Thiết kế hệ thống – Tổng quan

Phát triển hệ thống là một quy trình có hệ thống bao gồm các giai đoạn như lập kế hoạch, phân tích, thiết kế, triển khai và bảo trì. Trong bài viết này, chúng ta sẽ chủ yếu tập trung vào:

  • Phân tích hệ thống
  • Thiết kế hệ thống

Phân tích hệ thống

Đây là quá trình thu thập và diễn giải các sự kiện, xác định vấn đề và phân rã hệ thống thành các thành phần của nó.

Phân tích hệ thống được thực hiện nhằm mục đích nghiên cứu một hệ thống hoặc các phần của nó để xác định các mục tiêu của nó. Đây là một kỹ thuật giải quyết vấn đề giúp cải thiện hệ thống và đảm bảo rằng tất cả các thành phần của hệ thống hoạt động hiệu quả để đạt được mục đích của chúng.

Bước phân tích hệ thống xác định hệ thống cần làm gì.

Thiết kế hệ thống

Đây là quá trình lập kế hoạch một hệ thống kinh doanh mới hoặc thay thế một hệ thống hiện có bằng cách xác định các thành phần hoặc mô-đun của nó để đáp ứng các yêu cầu cụ thể. Trước khi lập kế hoạch, bạn cần hiểu rõ hệ thống cũ và xác định cách sử dụng máy tính tốt nhất để hoạt động hiệu quả.

Công việc thiết kế hệ thống tập trung vào cách đạt được mục tiêu của hệ thống.

Phân tích và Thiết kế hệ thống (System Analysis and Design – SAD) chủ yếu tập trung vào:

  • Hệ thống
  • Quy trình
  • Công nghệ

Hệ thống là gì?

Từ “Hệ thống” bắt nguồn từ từ Hy Lạp “Systema”, có nghĩa là một mối quan hệ có tổ chức giữa bất kỳ tập hợp các thành phần nào để đạt được một mục đích hoặc mục tiêu chung.

Hệ thống là “một nhóm các thành phần phụ thuộc lẫn nhau được liên kết với nhau theo một kế hoạch để đạt được một mục tiêu cụ thể.”

Các ràng buộc của hệ thống

Một hệ thống phải có ba ràng buộc cơ bản:

  1. Một hệ thống phải có cấu trúc và hành vi được thiết kế để đạt được một mục tiêu đã được định trước.
  2. Sự kết nối và phụ thuộc lẫn nhau phải tồn tại giữa các thành phần của hệ thống.
  3. Các mục tiêu của tổ chức có ưu tiên cao hơn so với các mục tiêu của các hệ thống con.

Ví dụ: hệ thống quản lý giao thông, hệ thống tính lương, hệ thống thư viện tự động, hệ thống thông tin nhân sự.

Các tính chất của hệ thống

Một hệ thống có các tính chất sau:

  • Tổ chức: Tổ chức ngụ ý cấu trúc và trật tự. Đó là sự sắp xếp các thành phần giúp đạt được các mục tiêu đã định trước.
  • Tương tác: Được xác định bởi cách các thành phần hoạt động với nhau.

Ví dụ: trong một tổ chức, phòng mua hàng phải tương tác với phòng sản xuất và phòng tính lương phải tương tác với phòng nhân sự.

  • Phụ thuộc lẫn nhau: Phụ thuộc lẫn nhau có nghĩa là các thành phần của hệ thống phụ thuộc vào nhau như thế nào. Để hoạt động đúng, các thành phần phải được phối hợp và liên kết với nhau theo một kế hoạch cụ thể. Đầu ra của một hệ thống con là đầu vào cần thiết của hệ thống con khác.
  • Tích hợp: Tích hợp liên quan đến việc các thành phần của hệ thống được kết nối với nhau như thế nào. Nó có nghĩa là các phần của hệ thống làm việc cùng nhau trong hệ thống ngay cả khi mỗi phần thực hiện một chức năng riêng biệt.
  • Mục tiêu trung tâm: Mục tiêu của hệ thống phải là trung tâm. Nó có thể là mục tiêu thực sự hoặc mục tiêu đã tuyên bố. Không có gì lạ khi một tổ chức tuyên bố một mục tiêu và hoạt động để đạt được mục tiêu khác.

Người sử dụng phải biết rõ mục tiêu chính của một ứng dụng máy tính từ sớm trong quá trình phân tích để thiết kế và chuyển đổi thành công.

Trong bài viết sau, chúng ta sẽ tiếp tục tìm hiểu các thành phần của hệ thống.

Phân loại thông tin

Có ba loại thông tin liên quan đến các cấp quản lý và các quyết định mà quản lý đưa ra.

Loại thông tin

Thông tin chiến lược
Loại thông tin này được yêu cầu bởi quản lý cấp cao nhất cho việc lập kế hoạch dài hạn trong những năm tiếp theo. Ví dụ, các xu hướng về doanh thu, đầu tư tài chính, nhân sự và sự tăng trưởng dân số.

Loại thông tin này được thu thập với sự hỗ trợ của Hệ thống Hỗ trợ quyết định (Decision Support System – DSS).

Thông tin quản lý
Loại thông tin này được yêu cầu bởi quản lý cấp trung cho việc lập kế hoạch ngắn hạn và trung hạn trong khoảng thời gian vài tháng. Ví dụ, phân tích doanh số, dự báo dòng tiền và báo cáo tài chính hàng năm.

Loại thông tin này được thu thập với sự hỗ trợ của Hệ thống thông tin quản lý (Management Information Systems – MIS).

Thông tin hoạt động
Loại thông tin này được yêu cầu bởi quản lý cấp thấp cho việc lập kế hoạch hàng ngày và ngắn hạn để thực hiện các hoạt động hàng ngày. Ví dụ, lưu giữ hồ sơ chấm công của nhân viên, các đơn hàng mua hàng quá hạn, và lượng hàng tồn kho hiện có.

Loại thông tin này được thu thập với sự hỗ trợ của Hệ thống xử lý dữ liệu (Data Processing Systems – DPS).

Nguồn: System Analysis and Design tutorial.

Thống kê hiện trạng chuyển đổi số

Trong bối cảnh kỹ thuật số phát triển nhanh chóng, các doanh nghiệp trên toàn cầu đang phải đối mặt với việc triển khai những công nghệ mới đầy hứa hẹn nhưng cũng gây bối rối. Thuật ngữ chuyển đổi số (digital transformation – DX) đề cập đến việc tích hợp những công nghệ này nhằm thúc đẩy năng suất, hiệu quả và bền vững hơn. Thuật ngữ này đã trở nên phổ biến trong thời kỳ đại dịch COVID-19 và đại diện cho sự chuyển đổi rộng lớn sang các phương thức kinh doanh linh hoạt và thông minh hơn. Trí tuệ nhân tạo (AI), dữ liệu lớn và điện toán đám mây được coi là các công nghệ cốt lõi có khả năng biến đổi mạnh mẽ với ứng dụng rộng rãi trên nhiều ngành công nghiệp, trong khi các lĩnh vực như sản xuất đang áp dụng robot chuyên biệt.

Chi tiêu đang tăng nhanh, với công nghệ đám mây đứng đầu

Chi tiêu toàn cầu cho chuyển đổi số đạt 1,85 nghìn tỷ đô la Mỹ vào năm 2022, tăng hơn 16% so với năm 2021. Đại dịch COVID-19 được cho là đã khởi động sự chi tiêu này cho nhiều doanh nghiệp, với sự gia tăng của làm việc từ xa thúc đẩy các tổ chức áp dụng công nghệ đám mây cho phép môi trường làm việc linh hoạt. Hơn 90% các tổ chức trên toàn thế giới đã triển khai công nghệ đám mây tính đến năm 2023, tỷ lệ áp dụng cao nhất trong số các công nghệ mới nổi, với chi tiêu toàn cầu cho đám mây công cộng ước tính đã vượt qua 560 tỷ đô la Mỹ trên toàn cầu.

Việc áp dụng AI khác nhau giữa các ngành

AI tạo sinh đại diện cho mũi nhọn của nhiều sáng kiến chuyển đổi số, tuy nhiên phần lớn các tổ chức trên toàn thế giới vẫn chưa triển khai công nghệ này. Việc triển khai toàn cầu đạt khoảng một phần ba các tổ chức trên toàn thế giới vào năm 2023, với tỷ lệ này tăng lên 40% ở Bắc Mỹ. Khi được triển khai, AI và học máy có thể cho phép ra quyết định thông minh cho các giám đốc điều hành thông qua mô hình dự đoán và cải thiện dịch vụ cho khách hàng thông qua cá nhân hóa và chatbot tự động. Tuy nhiên, những phức tạp liên quan đến việc triển khai AI đặt ra một ngưỡng cao cho việc tham gia, gây khó khăn cho các tổ chức nhỏ với ngân sách hạn chế.

Chuyển đổi lực lượng lao động

Việc áp dụng rộng rãi các quy trình kỹ thuật số mới đã thúc đẩy việc đánh giá lại vai trò của lực lượng lao động, với một số công nghệ yêu cầu kỹ năng và năng lực chuyên môn. Một loạt các kỹ năng kỹ thuật đang tăng cao về nhu cầu trong bối cảnh AI được áp dụng, với các kỹ năng học máy, phân tích dữ liệu và an ninh mạng nằm trong số những kỹ năng nổi bật. Nhiều công ty sẽ tìm đến Ấn Độ để đáp ứng nhu cầu này, với quốc gia này đứng đầu bảng xếp hạng về sự thâm nhập của kỹ năng AI, trong khi những công ty khác có thể tìm cách nâng cao kỹ năng cho nhân viên hiện tại trong bối cảnh thị trường học tập doanh nghiệp bùng nổ.

Nhiệm vụ của các tổ chức sẽ là cân bằng khi họ tiến tới triển khai những công nghệ mới mạnh mẽ đồng thời cân nhắc các mối quan tâm về an ninh mạng và đạo đức. Mặt khác, nhân viên sẽ tìm cách nâng cao danh mục kỹ năng của mình để thành công trong một thị trường việc làm toàn cầu đòi hỏi sự thành thạo kỹ thuật số và sẵn sàng đón nhận thay đổi.

Nguồn: Statista (tháng 6/2024).

Những nguyên nhân chính dẫn đến thất bại dự án là gì?

Nguồn: https://projectmanagementreport.com/blog/project-management-statistics

Nghiên cứu ngành và khảo sát các chuyên gia quản lý dự án tiết lộ các nguyên nhân hàng đầu dẫn đến thất bại dự án là:

1. Thiếu mục tiêu và phạm vi rõ ràng (64%)

2. Lập kế hoạch và dự báo không đầy đủ (57%)

3. Giao tiếp kém/kết nối không đồng bộ với các bên liên quan (56%)

4. Phân bổ tài nguyên không đủ (52%)

5. Quy trình quản lý thay đổi yếu kém (49%)

6. Thiếu sự hỗ trợ từ lãnh đạo (48%)

7. Quản lý rủi ro không hiệu quả (47%)

8. Lịch trình không thực tế (45%)

9. Phạm vi dự án mở rộng không kiểm soát (45%)

Những yếu tố hàng đầu này nhấn mạnh cách các vấn đề liên quan đến sự liên kết, lập kế hoạch, tài nguyên và khả năng thích ứng làm trật đường ray kết quả dự án. Mục tiêu mơ hồ, các nhóm làm việc riêng lẻ, rủi ro bị bỏ qua, thời hạn chặt chẽ, thay đổi không kiểm soát và các nhà tài trợ không gắn kết đều tạo nền tảng cho thất bại.

Xem xét kỹ hơn các nguyên nhân gốc rễ:

1. Mục tiêu không rõ ràng: Mục tiêu mơ hồ khiến không thể định nghĩa thành công có thể đo lường được hoặc điều chỉnh nhiệm vụ và kỳ vọng. Kết quả chịu ảnh hưởng nếu không có mục tiêu cụ thể để đánh giá tiến độ và sự hoàn thành.

2. Lập kế hoạch không đầy đủ: Lập kế hoạch không đủ về tài nguyên, ngân sách, lịch trình, rủi ro và yêu cầu làm cho các nhóm không chuẩn bị sẵn sàng để thực hiện một cách dự đoán. Khoảng trống không thể tránh khỏi khi công việc bắt đầu.

3. Giao tiếp kém: Giới hạn sự hợp tác liên chức năng và minh bạch góp phần vào sự không đồng bộ. Mọi người bị ngắt kết nối với kết quả và thay đổi, gây ra hiệu ứng dây chuyền.

4. Tài nguyên không đủ: Kế hoạch tài nguyên không thực tế làm căng thẳng các nhóm và cản trở năng suất. Công việc kéo dài hơn hoặc chất lượng giảm do khối lượng công việc không nhất quán.

5. Quản lý thay đổi yếu kém: Các thay đổi phạm vi không được quản lý chủ động. Thay vào đó, phạm vi mở rộng không kiểm soát làm lệch ngân sách, lịch trình, tài nguyên và chất lượng.

6. Thiếu hỗ trợ từ lãnh đạo: Các lãnh đạo không gắn kết không ủng hộ các dự án quan trọng hoặc cung cấp bảo vệ, làm cho các nhóm thiếu hỗ trợ.

7. Quản lý rủi ro không hiệu quả: Các nhóm phản ứng thay vì chủ động đối với các vấn đề mới nổi. Rủi ro không được xác định trở thành mối đe dọa lớn.

8. Lịch trình không thực tế: Lịch trình gấp gáp làm quá tải các nhóm và không để lại chỗ cho các tình huống dự phòng khi các vấn đề không thể tránh khỏi xuất hiện.

Tập hợp lại, những sai sót này ngăn cản các tổ chức tối đa hóa tỷ lệ thành công của dự án. Nhưng dữ liệu cũng cung cấp một lộ trình rõ ràng để cải thiện. Định nghĩa mục tiêu, lập kế hoạch kỹ lưỡng, giao tiếp chủ động, đảm bảo tài nguyên, kiểm soát thay đổi, nhận được sự ủng hộ của lãnh đạo, giảm thiểu rủi ro và lên lịch thực tế đều nằm trong tầm kiểm soát của quản lý.

Nhắm vào những khu vực này thông qua đào tạo, quy trình tinh chỉnh và quản trị sẽ mở khóa tỷ lệ thành công cao hơn theo thời gian. Kết quả dự án được xác định trực tiếp bởi các thực tiễn và văn hóa được xây dựng bởi ban lãnh đạo.

Các ứng dụng của Mạng Bayes trong AI

Mạng Bayes có thể được sử dụng cho nhiều ứng dụng trong AI và học máy (machine learning – ML). Trong bài “Mạng Bayes: Chìa khóa để khai mở tiềm năng thực sự của AI” ta đã xem xét một số ví dụ về ứng dụng của mạng Bayes trong AI qua các lĩnh vực chăm sóc sức khỏe, xe tự lái. Dưới đây là một số nhóm các cách sử dụng phổ biến của mạng Bayes: [1]

1. Suy diễn xác suất (hay Suy diễn Bayes): Mạng Bayes cho phép suy diễn xác suất, có nghĩa là chúng có thể trả lời các truy vấn về phân bố xác suất của các biến qua các bằng chứng quan sát được. Mạng Bayes có thể giúp tính toán xác suất hậu nghiệm của các biến không được quan sát dựa trên sự phụ thuộc xác suất trong mạng.

2. Chẩn đoán và hỗ trợ quyết định: Mạng Bayes được sử dụng rộng rãi trong các hệ thống hỗ trợ quyết định và chẩn đoán y tế. Bằng cách quan sát các triệu chứng hoặc bằng chứng, mạng Bayes có thể tính toán xác suất của các bệnh hoặc tình trạng khác nhau, hỗ trợ quá trình chẩn đoán. Mạng Bayes cũng có thể hỗ trợ việc ra quyết định bằng cách xem xét các xác suất và lợi ích gắn với các lựa chọn khác nhau.

3. Mô hình hóa dự đoán: Mạng Bayes có thể được sử dụng cho các nhiệm vụ mô hình hóa dự đoán. Với các biến quan sát được, mạng Bayes có thể giúp dự đoán giá trị của các biến không quan sát được hoặc ước tính xác suất của chúng. Điều này làm cho chúng hữu ích trong nhiều lĩnh vực khác nhau, chẳng hạn như dự báo thời tiết, phân tích tài chính và phân tích hành vi khách hàng.

4. Đánh giá và quản lý rủi ro: Mạng Bayes có giá trị trong việc đánh giá và quản lý rủi ro. Chúng có thể mô hình hóa sự phụ thuộc giữa các yếu tố rủi ro và ước tính xác suất của các kết quả hoặc sự kiện khác nhau. Điều này rất hữu ích trong các lĩnh vực như bảo lãnh bảo hiểm, quản lý dự án [2] và phân tích rủi ro môi trường.

5. Phát hiện bất thường: Mạng Bayes còn có thể được sử dụng cho các nhiệm vụ phát hiện bất thường. Bằng cách tìm hiểu hành vi bình thường của một hệ thống hoặc quy trình, chúng có thể phát hiện những sai lệch hoặc bất thường so với các mô hình dự kiến. Điều này rất hữu ích trong an ninh mạng, phát hiện gian lận và giám sát các quy trình công nghiệp.

6. Xử lý ngôn ngữ tự nhiên: Mạng Bayes cũng được ứng dụng trong các tác vụ xử lý ngôn ngữ tự nhiên. Chúng có thể được sử dụng cho các tác vụ như gắn thẻ một phần lời nói (part-of-speech), nhận dạng thực thể được đặt tên và phân tích ngữ nghĩa. Mạng Bayes có thể biểu diễn được sự phụ thuộc giữa các yếu tố ngôn ngữ và suy diễn những cách diễn giải hoặc cấu trúc có khả năng xảy ra nhất.

7. Mô hình hóa môi trường: Mạng Bayes được sử dụng trong mô hình hóa môi trường để hiểu các hệ thống phức tạp và đánh giá tác động môi trường. Chúng có thể được dùng để lập mô hình tương tác giữa các biến số như khí hậu, các hệ sinh thái và hoạt động của con người, từ đó đưa ra các dự đoán và phân tích kịch bản.

8. Tin sinh và gen: Mạng Bayes được sử dụng trong tin sinh học (bioinformatics) và gen để mô hình hóa và phân tích các tương tác di truyền và protein. Chúng có thể giúp hiểu được các mạng điều hòa gen, tương tác protein-protein và các mối liên hệ giữa bệnh-gen.

Hình bài: Các ứng dụng của mạng Bayes [1].

Xem toàn bộ tài liệu về mạng Bayes trong AI tại đây.

Nguồn tham khảo:

[1] https://www.leewayhertz.com/bayesian-networks-in-ai/

[2] http://luanvan.moet.gov.vn/?page=1.18&view=37045

Mạng Bayes: Chìa khóa để khai mở tiềm năng thực sự của AI

Mạng Bayes đại diện cho một công cụ mạnh mẽ để khai thác tiềm năng thực sự của AI. Bằng cách cho phép các hệ thống AI suy luận trong điều kiện bất định, học hỏi từ dữ liệu hạn chế và mô hình nhân quả, mạng Bayes có thể giúp vượt qua một số thách thức chính mà nghiên cứu AI ngày nay phải đối mặt.

Đọc được bài dịch trên VnExpress nhưng thấy nội dung dịch chưa rõ, chưa sát ý nên xin được dịch lại bài này.

Trí tuệ nhân tạo (AI) đã trải qua một chặng đường dài kể từ khi ra đời, với các kỹ thuật học máy và học sâu thúc đẩy những tiến bộ nhanh chóng trong lĩnh vực này. Tuy nhiên, bất chấp những tiến bộ ấn tượng, vẫn còn nhiều thách thức phải vượt qua trước khi AI thực sự có thể phát huy hết tiềm năng của mình. Một cách tiếp cận đầy hứa hẹn để giải quyết những thách thức này là sử dụng mạng Bayes, một mô hình đồ họa xác suất mạnh mẽ có khả năng mở ra các cấp độ hiểu biết và lý luận mới trong các hệ thống AI.

Mạng Bayes, được đặt theo tên của nhà toán học thế kỷ 18 Thomas Bayes, là một đồ thị có hướng biểu diễn một tập các biến và sự ràng buộc có điều kiện giữa chúng(*). Nói một cách đơn giản hơn, chúng cung cấp một cách để mô hình hóa các mối quan hệ phức tạp giữa các biến bằng cách nắm bắt cấu trúc xác suất cơ bản của dữ liệu. Điều này cho phép các hệ thống AI suy luận trong điều kiện bất định, học tập từ nguồn dữ liệu hạn chế và đưa ra quyết định sáng suốt dựa trên dữ kiện sẵn có.

Một trong những ưu điểm chính của mạng Bayes là khả năng xử lý sự bất định (uncertainty) và thông tin khuyết thiếu. Trong nhiều tình huống thực tế, các hệ thống AI phải đưa ra quyết định dựa trên dữ liệu khuyết thiếu hoặc bị nhiễu. Các kỹ thuật máy học truyền thống, chẳng hạn như mạng thần kinh, thường gặp khó khăn trong các tình huống này vì chúng yêu cầu lượng lớn dữ liệu được đào tạo để đạt được mức độ chính xác cao. Ngược lại, Mạng Bayes có thể đưa ra dự đoán chính xác ngay cả khi phải đối mặt với hạn chế dữ liệu, vì chúng có thể kết hợp kiến thức trước đó và cập nhật thông tin khi có bằng chứng mới. (**)

Một lợi ích khác của mạng Bayes là khả năng cung cấp AI có thể hiểu và giải thích được. Khi các hệ thống AI ngày càng được tích hợp nhiều hơn vào cuộc sống hàng ngày của chúng ta, điều quan trọng là chúng ta phải hiểu lý do đằng sau các quyết định của chúng. Cấu trúc đồ họa của mạng Bayes cho phép hình dung rõ ràng mối quan hệ giữa các biến, giúp con người dễ dàng hiểu được quá trình ra quyết định hơn. Sự minh bạch này rất cần thiết để xây dựng niềm tin vào các hệ thống AI và đảm bảo rằng chúng được sử dụng một cách có trách nhiệm và có đạo đức.

Hơn nữa, mạng Bayes có thể được sử dụng để mô hình hóa quan hệ nhân quả – một khía cạnh quan trọng trong lý luận và ra quyết định của con người. Mặc dù các kỹ thuật học máy truyền thống có thể xác định mối tương quan giữa các biến, nhưng chúng thường gặp khó khăn trong việc xác định mối quan hệ nhân quả làm nền tảng cho những mối tương quan này. Bằng cách mô hình hóa rõ ràng các mối quan hệ nhân quả, mạng Bayes có thể giúp các hệ thống AI hiểu rõ hơn về cơ chế cơ bản của các hệ thống phức tạp và đưa ra các quyết định sáng suốt hơn.

Trong những năm gần đây, mối quan tâm về mạng Bayes trong cộng đồng nghiên cứu AI đang gia tăng trở lại. Điều này một phần là do sự phát triển của các thuật toán và kỹ thuật tính toán mới giúp làm việc với mạng Bayes quy mô lớn dễ dàng hơn. Ngoài ra, sự sẵn có ngày càng tăng của dữ liệu và độ phức tạp ngày càng tăng của các ứng dụng AI đã làm nổi bật nhu cầu về khả năng suy luận và ra quyết định phức tạp hơn.

Một lĩnh vực mà mạng Bayes đã thể hiện nhiều hứa hẹn là lĩnh vực chăm sóc sức khỏe. Bằng cách mô hình hóa mối quan hệ phức tạp giữa các triệu chứng của bệnh nhân, tiền sử bệnh và các lựa chọn điều trị, mạng Bayes có thể giúp các bác sĩ đưa ra chẩn đoán và khuyến nghị điều trị chính xác hơn. Điều này có khả năng cải thiện đáng kể kết quả của bệnh nhân và giảm chi phí chăm sóc sức khỏe.

Một ứng dụng đầy hứa hẹn khác của mạng Bayes là trong lĩnh vực xe tự lái. Bằng cách mô hình hóa các tương tác phức tạp giữa các phương tiện, người đi bộ và môi trường, mạng Bayes có thể giúp cải thiện độ an toàn và độ tin cậy của ô tô tự lái. Điều này đặc biệt quan trọng do mức độ không chắc chắn và khó lường cao liên quan đến các tình huống lái xe trong thế giới thực.

Tóm lại, mạng Bayes đại diện cho một công cụ mạnh mẽ để khai thác tiềm năng thực sự của AI. Bằng cách cho phép các hệ thống AI suy luận trong điều kiện bất định, học hỏi từ dữ liệu hạn chế và mô hình nhân quả, mạng Bayes có thể giúp vượt qua một số thách thức chính mà nghiên cứu AI ngày nay phải đối mặt. Khi lĩnh vực này tiếp tục phát triển, có khả năng chúng ta sẽ thấy mạng Bayes đóng vai trò ngày càng quan trọng trong việc phát triển các hệ thống AI thông minh, minh bạch và đáng tin cậy.

Link bài gốc trên Digital Technology Guru.

Bình luận, chú thích của người dịch:

(*) Thực ra theo [1] mạng Bayes là một đồ thị dạng đặc biệt, ngoài các nút (các biến) và đồ thị biểu diễn mối quan hệ giữa các nút, thì mỗi nút còn gắn với một bảng phân phối xác suất. Hình dưới đây biểu diễn rõ điều đó qua ví dụ về mạng Bayes đơn giản gồm 3 biến (giả sử việc chậm tiến độ một công việc nào đó – delay in task, có quan hệ nhân quả với khả năng đúng hạn của nhà thầu phụ – subcontract, và chất lượng nhân viên – staff quality)

(**) Chính vì vậy mạng Bayes còn được gọi là mạng niềm tin Bayes (Bayesian Belief Networks), do “niềm tin” trước đó được cập nhật khi có bằng chứng mới.

Mạng Bayes dựa trên Định lý hay luật Bayes, với công thức nổi tiếng ở dạng đơn giản biểu diễn xác suất giữa các biến như sau:

P(R/S) = P(S/R)*P(R)/P(S)

Quy tắc Bayes ở trên được hiểu theo nghĩa cập nhật niềm tin (xác suất hậu nghiệm của từng trạng thái có thể có của một biến, nghĩa là các xác suất trạng thái sau khi xem xét tất cả các bằng chứng có sẵn) về giả thuyết R dưới góc độ bằng chứng mới S. Vì vậy, niềm tin hậu nghiệm P(R/S) được tính bằng cách nhân niềm tin trước đó P(R) với khả năng P(S/R) rằng S sẽ xảy ra nếu R đúng.[1]

Công thức trên cũng có tính đối xứng (hai chiều) nên có thể biết hoặc tiên đoán 1 đại lượng sau nếu biết hoặc giả định các đại lượng khác.

(***) Thomas Kehler, thành viên của Global Enlightenment Mountain, Giám đốc Khoa học của CrowdSmart nhận xét về bài viết như sau [2]:

“Bài báo đưa ra quan điểm cực kỳ quan trọng – Mạng Bayes trao quyền cho một thế hệ AI mới, mở ra cơ hội đưa trí tuệ tập thể của con người vào. Trong 8 năm qua, trọng tâm công việc của tôi và công việc của CrowdSmart là sử dụng Mạng niềm tin Bayes* như một phương tiện tích hợp thế hệ AI hiện tại với trí tuệ tập thể của con người. Judea Pearl, người đóng góp quan trọng ban đầu cho Mạng niềm tin Bayes, đã tuyên bố ‘Bạn thông minh hơn dữ liệu của mình’. Cho đến nay, với tất cả những tiến bộ vượt bậc mà chúng tôi đã đạt được trong lĩnh vực AI, việc học tập đều dựa trên dữ liệu chúng tôi đã tạo ra, tức dữ liệu của chúng tôi. Hãy nghĩ về việc sức mạnh của AI hiện tại và trí tưởng tượng chung của con người cùng nhau sáng tạo. Đó là tương lai và Mạng Bayes đóng vai trò quan trọng trong tương lai đó.”

Trí tuệ nhân tạo (AI) đã đi được một chặng đường dài kể từ khi ra đời, với các kỹ thuật học máy và học sâu thúc đẩy những tiến bộ nhanh chóng trong lĩnh vực này. Tuy nhiên, dù có những tiến bộ ấn tượng nhưng vẫn còn nhiều thách thức cần vượt qua trước khi AI thực sự có thể phát huy hết tiềm năng của mình. Một cách tiếp cận đầy hứa hẹn để giải quyết những thách thức này là sử dụng mạng Bayes, một mô hình đồ họa xác suất mạnh mẽ có tiềm năng mở ra những cấp độ hiểu biết và lý luận mới trong các hệ thống AI.

(****) Bài rất dài nhưng chi tiết về mạng Bayes trong AI có thể xem tại [3] hoặc xem tài liệu tiếng Việt dạng PDF tại đây.

Các nguồn tham khảo:

[1] http://luanvan.moet.edu.vn/?page=1.18&view=37045 

[2] https://bostonglobalforum.org/news/global-enlightenment-mountains-thomas-kehler-bayesian-networks-empower-a-new-generation-of-ai/ 

[3] https://www.leewayhertz.com/bayesian-networks-in-ai/ 

Các trang web và tài nguyên cho dữ liệu mở

May mắn cho các nhà phân tích dữ liệu là có rất nhiều trang web và tài nguyên đáng tin cậy sẵn có cho dữ liệu mở. Cần lưu ý là ngay cả dữ liệu có uy tín cũng cần được đánh giá liên tục, nhưng những trang web sau vẫn là những nguồn dữ liệu khởi đầu hữu ích:

Trang dữ liệu của Chính phủ Mỹ: Data.gov là một trong những nguồn dữ liệu toàn diện nhất ở nước Mỹ. Tài nguyên này cung cấp cho người dùng dữ liệu và công cụ cần thiết để thực hiện nghiên cứu, thậm chí còn giúp họ phát triển các ứng dụng web và di động cũng như thiết kế trực quan hóa dữ liệu. 

Cục điều tra dân số Mỹ (U.S. Census Bureau): Nguồn dữ liệu mở này cung cấp thông tin nhân khẩu học từ chính quyền liên bang, tiểu bang và địa phương cũng như các tổ chức thương mại ở nước Mỹ.

Open Data Network: Nguồn dữ liệu này có một công cụ tìm kiếm thực sự mạnh mẽ và các bộ lọc nâng cao. Tại đây, bạn có thể tìm thấy dữ liệu về các chủ đề như tài chính, an toàn công cộng, cơ sở hạ tầng, nhà ở và phát triển.

Google Cloud Public Datasets: Có một số bộ dữ liệu công khai có sẵn thông qua Chương trình bộ dữ liệu công khai trên đám mây của Google mà bạn có thể thấy là đã được tải vào BigQuery.  

Dataset Search: Dataset Search là một công cụ tìm kiếm được thiết kế dành riêng cho các tập dữ liệu; bạn có thể sử dụng công cụ này để tìm kiếm các tập dữ liệu cụ thể.

Các cấp độ và kỹ thuật mô hình hóa dữ liệu

Bài viết này giới thiệu cho bạn về mô hình hóa dữ liệu và các loại mô hình dữ liệu khác nhau. Các mô hình dữ liệu giúp giữ cho dữ liệu nhất quán và cho phép mọi người vạch ra cách tổ chức dữ liệu. Hiểu biết cơ bản giúp các nhà phân tích và các bên liên quan khác dễ dàng hiểu được dữ liệu của họ và sử dụng dữ liệu đó theo đúng cách.

Bài viết này giới thiệu cho bạn về mô hình hóa dữ liệu và các loại mô hình dữ liệu khác nhau. Các mô hình dữ liệu giúp giữ cho dữ liệu nhất quán và cho phép mọi người vạch ra cách tổ chức dữ liệu. Hiểu biết cơ bản giúp các nhà phân tích và các bên liên quan khác dễ dàng hiểu được dữ liệu của họ và sử dụng dữ liệu đó theo đúng cách.

Lưu ý quan trọng: Nếu là một nhà phân tích dữ liệu mới vào nghề, bạn sẽ không được yêu cầu thiết kế mô hình dữ liệu. Nhưng bạn có thể bắt gặp các mô hình dữ liệu hiện có mà tổ chức của bạn đã có sẵn.

Mô hình hóa dữ liệu là gì?

Mô hình hóa dữ liệu là quá trình tạo sơ đồ thể hiện trực quan cách tổ chức và cấu trúc dữ liệu. Những biểu diễn trực quan này được gọi là mô hình dữ liệu. Bạn có thể coi mô hình dữ liệu như một bản thiết kế của một ngôi nhà. Tại bất kỳ thời điểm nào, có thể có thợ điện, thợ mộc và thợ sửa ống nước sử dụng bản thiết kế đó. Mỗi người trong số những người thợ xây dựng này có mối quan hệ khác nhau với bản thiết kế, nhưng tất cả họ đều cần nó để hiểu cấu trúc tổng thể của ngôi nhà. Các mô hình dữ liệu cũng tương tự; những người dùng khác nhau có thể có các nhu cầu dữ liệu khác nhau, nhưng mô hình dữ liệu mang lại cho họ sự hiểu biết về toàn bộ cấu trúc.

Các cấp độ mô hình hóa dữ liệu

Mỗi cấp độ mô hình hóa dữ liệu có một mức độ chi tiết khác nhau.

kim tự tháp với ba loại mô hình hóa dữ liệu phổ biến: khái niệm, logic và vật lý

Mô hình hóa dữ liệu khái niệm cung cấp chế độ xem ở mức cao về cấu trúc dữ liệu, chẳng hạn như cách dữ liệu tương tác trong một tổ chức. Ví dụ, một mô hình dữ liệu khái niệm có thể được sử dụng để xác định các yêu cầu kinh doanh cho một cơ sở dữ liệu mới. Một mô hình dữ liệu khái niệm không chứa các chi tiết kỹ thuật.

Mô hình hóa dữ liệu logic tập trung vào các chi tiết kỹ thuật của cơ sở dữ liệu như mối quan hệ, thuộc tính và thực thể. Ví dụ: một mô hình dữ liệu logic xác định cách các bản ghi riêng lẻ được xác định duy nhất trong cơ sở dữ liệu. Nhưng nó không đánh vần tên thực của các bảng cơ sở dữ liệu. Đó là công việc của một mô hình dữ liệu vật lý.

Mô hình hóa dữ liệu vật lý mô tả cách cơ sở dữ liệu hoạt động. Một mô hình dữ liệu vật lý xác định tất cả các thực thể và thuộc tính được sử dụng; ví dụ, nó bao gồm tên bảng, tên cột và kiểu dữ liệu cho cơ sở dữ liệu.

Thông tin thêm có thể được tìm thấy trong phần so sánh các mô hình dữ liệu này.

Kỹ thuật mô hình hóa dữ liệu

Có rất nhiều cách tiếp cận khi phát triển mô hình dữ liệu, nhưng hai phương pháp phổ biến là Sơ đồ mối quan hệ thực thể (Entity Relationship Diagram ERD) và sơ đồ Ngôn ngữ mô hình hóa thống nhất (Unified Modeling Language – UML). ERD là một cách trực quan để hiểu mối quan hệ giữa các thực thể trong mô hình dữ liệu. Sơ đồ UML là những sơ đồ rất chi tiết mô tả cấu trúc của một hệ thống bằng cách hiển thị các thực thể, thuộc tính, hoạt động của hệ thống và các mối quan hệ của chúng. Nếu là một nhà phân tích dữ liệu mới vào nghề, bạn cần hiểu rằng có nhiều kỹ thuật lập mô hình dữ liệu khác nhau, nhưng trên thực tế, có thể bạn sẽ sử dụng kỹ thuật hiện có của tổ chức mình.

Bạn có thể đọc thêm về ERD, UML và từ điển dữ liệu trong bài viết về kỹ thuật lập mô hình dữ liệu này.

Phân tích dữ liệu và mô hình hóa dữ liệu

Mô hình hóa dữ liệu có thể giúp bạn khám phá các chi tiết ở mức độ cao về dữ liệu của mình và cách dữ liệu đó có liên quan trên các hệ thống thông tin của tổ chức. Mô hình hóa dữ liệu đôi khi yêu cầu phân tích dữ liệu để hiểu cách dữ liệu được kết hợp với nhau; theo cách đó, bạn biết cách lập bản đồ dữ liệu. Và cuối cùng, các mô hình dữ liệu giúp mọi người trong tổ chức của bạn hiểu và cộng tác với bạn trên dữ liệu của bạn dễ dàng hơn. Điều này rất quan trọng đối với bạn và mọi người trong nhóm của bạn!

Chuyển đổi số đang làm trầm trọng thêm bất bình đẳng xã hội như thế nào

Một góc nhìn về bất bình đẳng kỹ thuật số, dẫn đến bất bình đẳng xã hội của GS Alexander van Deursen, ĐH Twente, Hà Lan. Qua những câu chuyện, ví dụ chúng ta có thể thấy chúng ta ở đâu đó, vào lúc nào đó cũng như vậy.

Bài gốc trên website của ĐH Twente, Hà Lan.

Chúng ta sống trong một thế giới mà hầu hết mọi người đều trực tuyến. Internet là nguồn thông tin gần như vô tận, là không gian để chúng ta giữ liên lạc với những người thân yêu và là nơi chúng ta làm việc và tiêu dùng. Nhưng nếu bạn không có quyền truy cập internet, vì thiếu động lực, thiếu kỹ năng hoặc không có máy tính thì sao? Bất bình đẳng kỹ thuật số làm tăng khoảng cách xã hội giữa mọi người và thậm chí có thể dẫn đến sự loại trừ ai đó. Alexander van Deursen, giáo sư khoa học truyền thông tại Đại học Twente, Hà Lan đang nghiên cứu nguyên nhân phát sinh bất bình đẳng kỹ thuật số và cách chúng ta có thể chống lại nó.

Tác giả: Roel van der Heijden

Kim sử dụng Internet như một tạp chí hào nhoáng vô tận, nơi cô có thể tìm thấy câu trả lời cho mọi câu hỏi của mình về sức khỏe và các mối quan hệ. Điều đó khiến cô cảm thấy tự tin hơn. Willem dành vài giờ mỗi ngày trên YouTube và Facebook, nơi anh cảm thấy được lắng nghe bởi những người cùng tư tưởng, chí hướng. Anh ấy có thể đối phó với sự thất vọng của mình, nếu nó phát sinh, theo cách đó. Amina có một chiếc máy tính bảng mà các con của cô ấy có thể sử dụng để tra cứu thông tin. Bằng cách đó, bọn trẻ theo kịp việc học tại trường trường và học nhanh hơn.

Tuy nhiên, với tất cả những gì đang đọc, Kim cũng luôn tìm kiếm chế độ ăn kiêng phù hợp mà cô ấy không thể tìm thấy. Willem bắt đầu tin vào các thuyết âm mưu và ngày càng vướng vào ảo tưởng của chính mình. Trong cuộc khủng hoảng vi-rút corona, một máy tính bảng được chứng minh là không đủ cho ba đứa con của Amina. Các con của cô hiện đã bị tụt lại phía sau ở trường học.

Công nghệ mới có thể có những tác động tích cực cũng như tiêu cực. Làm thế nào để bạn ngăn chặn các khía cạnh tiêu cực có thể chiếm thế thượng phong? Ngoài ra, làm thế nào để bạn tránh được những yếu tố tiêu cực chủ yếu ảnh hưởng đến một nhóm người cụ thể trong xã hội? Các ví dụ trên được lấy từ bài giảng mở đầu của GS Alexander van Deursen với tựa đề ‘Nghịch lý bao trùm kỹ thuật số’ vào ngày 13/4/2023. Giáo sư Alexander van Deursen giữ ghế chủ tịch ‘Bất bình đẳng kỹ thuật số’ trong Bộ môn khoa học truyền thông tại Khoa Khoa học Hành vi, Quản lý và Xã hội của Đại học Twente. Ông là người sáng lập và giám đốc của Trung tâm Hòa nhập Kỹ thuật số tại khoa này. 

Các ví dụ minh họa những hệ quả sâu rộng của quá trình chuyển đổi số. Nắm vững các kỹ năng kỹ thuật số hiện là một phần thiết yếu trong cuộc sống hàng ngày của chúng ta. Điều đó không chỉ bao gồm các kỹ năng cơ bản để vận hành máy tính. Điều quan trọng không kém là mọi người sử dụng công nghệ một cách có trách nhiệm và họ có thể cảm nhận được những cạm bẫy. Nghiên cứu của GS Van Deursen tập trung vào nguyên nhân và hậu quả của bất bình đẳng kỹ thuật số, thường xuất phát từ vị trí của một cá nhân trong xã hội và các nguồn tài nguyên mà họ có quyền truy cập. Trình độ học vấn, thu nhập, sức khỏe, trình độ biết chữ hoặc mạng lưới xã hội là những ví dụ về các yếu tố tác động.

CHATGPT

Phạm vi và chiều sâu của các khả năng kỹ thuật số đang gia tăng nhanh chóng. Để chứng minh điều này, GS Van Deursen đã nhờ ChatGPT, một mô hình ngôn ngữ tiên tiến sử dụng trí tuệ nhân tạo để tạo ra văn bản trôi chảy theo yêu cầu, viết bài giảng mở đầu cho ông. Kết quả là tuyệt vời, ông cho biết. Mặc dù những công nghệ mới như vậy mang lại nhiều cơ hội, nhưng ngày càng có một nhóm nhỏ người được định vị để gặt hái những lợi ích. “Những thành viên thiệt thòi trong xã hội được hưởng lợi tương đối ít hơn từ những phát triển này, đồng thời, họ cũng là những người có nhiều khả năng bị ảnh hưởng bởi những trải nghiệm tiêu cực.”

Alexander van Deursen

Những thành viên thiệt thòi trong xã hội được hưởng lợi tương đối ít hơn từ những phát triển này, đồng thời, họ cũng là những người có nhiều khả năng bị ảnh hưởng bởi những trải nghiệm tiêu cực.

– Alexander van Deursen.

Trong bài diễn văn mở đầu của mình, ông đưa ra một số ví dụ về những cạm bẫy kỹ thuật số, bao gồm sắp xếp theo thuật toán (vốn là cơ sở phát sinh vụ bê bối trợ cấp chăm sóc trẻ em ở Hà Lan), các hệ thống tín dụng đáng ngờ, phòng phản hồi trên mạng xã hội, vi phạm quyền riêng tư, nhưng cũng là chứng nghiện mạng xã hội, các vấn đề về khoảng chú ý và rối loạn nhân cách. “Những rủi ro là có thật, và những mối nguy hiểm đang gia tăng. Quy định pháp luật để khắc phục các khía cạnh tiêu cực của công nghệ thường đi sau thực tiễn.”

CÁC THIẾT BỊ THÔNG MINH, NHƯNG QUYẾT ĐỊNH KHÔNG SÁNG SUỐT

Chuyển đổi số tiếp tục len lỏi sâu hơn vào cuộc sống của chúng ta thông qua các thiết bị chúng ta sử dụng ở nhà, tại nơi làm việc và trên đường đi. Chúng ta có nhiều thiết bị thông minh như máy điều nhiệt, thiết bị đeo, tivi, lò nướng và thậm chí cả tất trẻ em. Hệ thống Internet of Things (internet vạn vật – IoTs) phức tạp đang phát triển nhanh chóng. Nó nhằm làm cho cuộc sống dễ dàng hơn, bền vững hơn hoặc an toàn hơn cho tất cả chúng ta và sẽ giúp chúng ta đưa ra quyết định đúng đắn, chẳng hạn như về sức khỏe hoặc tính bền vững. GS Van Deursen nói: “Tuy nhiên, nghiên cứu của chúng tôi chỉ ra rằng hệ thống này không cải thiện quá trình ra quyết định của nhiều người. “Mọi người cảm thấy khó đánh giá một quyết định được đưa ra bởi một hệ thống. Sử dụng các thiết bị thông minh thường không dẫn đến hành vi bền vững, mặc dù đó là ý định.”

CẦN NHIỀU HƠN LÀ CHỈ TẶNG LAPTOP

Chuyển đổi số thường được coi là một điều tốt cho tất cả mọi người. Tuy nhiên, những tác động tiêu cực cũng có thể lấn át những kết quả tích cực. GS Alexander van Deursen đưa ra thuật ngữ “nghịch lý bao trùm kỹ thuật số” (digital inclusion paradox).

Làm thế nào để chúng ta giải quyết điều này? GS Van Deursen nói rằng bất bình đẳng kỹ thuật số đang ngày càng được chú ý và nó chiếm vị trí cao trong chương trình nghị sự chính trị. “Nhiều sáng kiến ​​tập trung vào việc đưa mọi người lên mạng, từ việc tổ chức các khóa học đến phát máy tính xách tay. Ý tưởng là sau đó mọi thứ sẽ ổn khi mọi người có thể xử lý công nghệ. Nhưng việc sử dụng ngày càng trở nên quan trọng. Ví dụ: hiểu được rằng bạn không nên chia sẻ thông tin của mình với bất kỳ ai hoặc không phải tất cả tin tức trực tuyến đều là sự thật. Theo nghĩa đó, điều quan trọng không chỉ là phát huy những tác động tích cực mà còn phải tránh những hậu quả tiêu cực của công nghệ.”

TĂNG KHẢ NĂNG PHỤC HỒI

Làm cho mọi người trở nên ‘kiên cường kỹ thuật số’ nên bắt đầu từ trường học, tốt nhất là càng sớm càng tốt. Theo GS Van Deursen, người lớn cũng nên được đào tạo thông qua các khóa học hoặc lớp học cộng đồng hoặc thư viện chẳng hạn.

GS Van Deursen cho biết trách nhiệm đối với việc quy định liên quan sử dụng kỹ thuật số của chúng ta thuộc về chính phủ, nhưng cũng rõ ràng thuộc về các nhà sản xuất công nghệ. Ví dụ: lấy các điều khoản và điều kiện mà chúng tôi buộc phải hiểu để sử dụng một số thiết bị hoặc dịch vụ nhất định. “Nhiều người cảm thấy không thể đọc hết và hiểu ba mươi sáu trang ‘ngôn ngữ pháp lý’. Chúng ta thường chấp nhận điều này (coi nó không cần thiết). Tuy nhiên, do số lượng dữ liệu cá nhân được thu thập ngày càng tăng, chúng ta cần hiểu điều gì xảy ra với thông tin cá nhân và ai có thể truy cập thông tin cá nhân. Điều này rất quan trọng đối với quyền riêng tư, bảo mật và tự do của chúng ta. Theo nghĩa đó, việc hiểu các điều khoản và điều kiện sử dụng nên được quan tâm đúng mức.

8 GIAI ĐOẠN TRONG VÒNG ĐỜI DỮ LIỆU

Không có hai dự án dữ liệu nào giống hệt nhau. Tuy nhiên các dự án dữ liệu có xu hướng tuân theo cùng một chu trình.

Subscribe to continue reading

Subscribe to get access to the rest of this post and other subscriber-only content.