Xử lý những tình huống của trí tuệ nhân tạo (Phần 2)
Sự trỗi dậy của quá trình học tập không giám sát “Transformer”
Những đổi mới trong AI (Máy tính, Dữ liệu, Lưu trữ) kết hợp với Internet vạn vật (IoT) (cho các hoạt động tự hành) và 5G (cho giao tiếp luôn ở chế độ bật, độ trễ thấp) đang dẫn đến một loại lõi công nghệ hoàn toàn mới là AIoT (Vạn vật đều có trí tuệ nhân tạo), trong đó các mô hình kinh doanh cốt lõi được xây dựng xung quanh một loạt các cải tiến công nghệ mới. Bằng cách quan sát hành động hoặc hành vi của các mẫu và mối quan hệ giữa các thực thể chính, ví dụ những từ ngữ được sử dụng trong một câu chuyện hoặc hình ảnh động vật trong video, hệ thống khởi động sự tìm hiểu tổng thể về ngữ cảnh, đây là quá trình học tập không giám sát. [8 ] Học tập không giám sát có thể mở rộng quy mô AI một cách nhanh chóng và dẫn đến việc áp dụng cho nhiều ngành dọc.
Học tập không giám sát đang được ứng dụng nhiều trong xử lý ngôn ngữ tự nhiên (NLP) nhờ vào kiến trúc học tập không giám sát mới được gọi là Transformer. Hiện tại đã bước đột phá về công nghệ, đó là sự ra đời của mô hình chuyển đổi tín hiệu thành văn bản Transformer 3 được đào tạo chung trước, được gọi là GPT-3 [9] của OpenAI. Mô hình này khiến thế giới công nghệ và giới kinh doanh cùng say mê. Giờ đây, mô hình này có thể viết những bài thơ hay, tạo mã hoạt động, soạn các bản ghi nhớ trong kinh doanh, viết các bài báo về chính nó, và hơn thế nữa, bằng cách tận dụng dữ liệu khổng lồ, với khoảng 175 tỷ thông số, nó có thể tự đào tạo. Ban đầu việc sử dụng còn nhiều lỗi nhưng trong tương lai kết quả sẽ rất thú vị. Siêu AI của Trung Quốc Wu Dao 2.0, mô hình ngôn ngữ lớn nhất cho đến nay, có tới 1,75 nghìn tỷ tham số, là một ví dụ thành công của cách tiếp cận này. Nó đã vượt qua GPT-3 của OpenAI và Switch Transformer của Google về kích thước. Học viện Trí tuệ Nhân tạo Bắc Kinh (BAAI) do chính phủ Trung Quốc tài trợ đã ủng hộ phát triển Wu Dao 2.0 và nhằm mục đích cho phép máy móc suy nghĩ giống như con người và đạt được khả năng nhận thức tốt hơn việc thi đỗ bài kiểm tra Turing đo khả năng máy tính suy nghĩ giống con người.
Những máy biến đổi như vậy có thể phá vỡ hoàn toàn nền tảng mới trong AI và tạo ra các tiện ích theo chiều ngang, có thể được các công ty khởi nghiệp nhanh chóng tận dụng để xây dựng sự khác biệt và gia trị gia tăng, dựa trên các trường hợp khách hàng của họ sử dụng tiện ích. Cách tiếp cận này cuối cùng có thể tràn sang các lĩnh vực chính khác đang thử nghiệm AI. Tuy nhiên, cách tiếp cận này có thể quá tốn nhiều dữ liệu và máy tính và có thể phản tác dụng về lâu dài từ góc độ sử dụng năng lượng.
Máy tính nhận thức được quyền riêng tư và đấu tranh giành dữ liệu
Một trong những thách thức bao trùm của nền kinh tế trải nghiệm do AI định hướng là xây dựng AI trong khi đảm bảo quyền riêng tư của dữ liệu. Bởi vì dữ liệu là máu của trí tuệ nhân tạo hiện đại, các vấn đề về quyền riêng tư của dữ liệu đóng một vai trò quan trọng và thường là hạn chế trong quỹ đạo phát triển của AI. Quy định bảo vệ dữ liệu khắc nghiệt cướp đi tác động biến đổi của AI do cá nhân hóa sâu mang lại. Tuy nhiên, vì lý do đạo đức, dữ liệu cá nhân phải được bảo vệ và chỉ được cung cấp khi có sự đồng ý. Các kiến trúc hiện tại có cách tiếp cận “một trong hai”, hoặc sử dụng dữ liệu, hoặc bảo vệ tính riêng tư của dữ liệu, trong việc khai thác dữ liệu, hạn chế lượng dữ liệu mà hệ thống AI có thể học mà không xâm phạm quyền riêng tư. Cuộc chiến giành dữ liệu học tập mở sẽ trở thành một thách thức lớn đối với thời đại được thúc đẩy bởi AI. Mô hình hiện tại của một số công ty tích lũy một lượng lớn dữ liệu và khả năng tính toán để thúc đẩy AI học sâu, cùng với vai trò ngày càng giảm của các trường đại học do đang phải vật lộn với việc thay thế nhân tài bằng AI [10], có thể phản tác dụng đối với sự phát triển của các đổi mới toàn diện trong tương lai. Sự trỗi dậy của AI có khả năng nhận biết quyền riêng tư và biết tính toán bí mật là điều đáng chú ý trong vấn đề này.
Thông qua cơ quan Niti Aayog, Chính phủ Ấn Độ Một đã xây dựng khuôn khổ để chia sẻ dữ liệu nhạy cảm về quyền riêng tư, như dữ liệu tài chính hoặc sức khỏe của công dân. Khuôn khổ này được gọi là Kiến trúc quyền riêng tư và trao quyền dữ liệu (DEPA) [11]. Thiết kế của khuôn khổ này kết hợp quyền riêng tư và sự đồng ý tích cực. Thu lợi từ dữ liệu là quan trọng từ quan điểm của quốc gia đang phát triển vì mọi người đang trở nên giàu có về mặt dữ liệu trước khi họ giàu có về tài sản. Khía cạnh quan trọng của kiến trúc này là khái niệm về người quản lý sự đồng ý, ai sẽ là người đóng vai trò lấy được sự đồng ý từ chủ sở hữu dữ liệu, với sự đồng ý này được ghi lại ở định dạng chuẩn hóa dựa trên ngôn ngữ XML. Cách tiếp cận này đầy hứa hẹn và kết hợp với những tiến bộ công nghệ trong việc sử dụng phần cứng an toàn đáng tin cậy, và có thể là một yếu tố thay đổi cuộc chơi. Mặc dù các phiên mạng và lưu trữ được mã hóa thường bảo vệ dữ liệu trong hầu hết các trường hợp, nhưng việc sử dụng cơ sở hạ tầng và dịch vụ được chia sẻ như phiên bản đám mây và vùng chứa có khả năng mở ra các ứng dụng và dữ liệu dễ bị tấn công trong khi chúng đang thực thi nhiệm vụ. Hơn nữa, vì dữ liệu phải không được mã hóa trong quá trình thực thi mã, nên không quan trọng việc nó được xử lý an toàn như thế nào trong quá trình lưu trữ hoặc vận chuyển. Thay vào đó, cách duy nhất để đảm bảo an toàn dữ liệu trong quá trình thực thi ứng dụng là khai thác các tính năng phần cứng trong các bộ xử lý hiện đại được gọi là môi trường thực thi đáng tin cậy. Điều này sẽ đảm bảo rằng, việc cộng tác dữ liệu an toàn sẽ rộng rãi hơn và quan trọng hơn là có thể truy cập một cách an toàn. Do đó, điều này sẽ tạo ra sự tin tưởng nhiều hơn giữa các chủ sở hữu dữ liệu để họ cộng tác, cho phép cung cấp rộng rãi hơn các nguồn dữ liệu phong phú hơn. Điều này sẽ dẫn đến sự phát triển và tiến bộ toàn diện hơn của AI với các mô hình dữ liệu thay thế.
Phương pháp tiếp cận để tạo ra một hệ sinh thái đổi mới toàn diện, mạnh mẽ và công bằng trong IA
Câu hỏi lớn trong mắt các nhà hoạch định chính sách và cơ quan quản lý là làm thế nào để đảm bảo rằng, chúng ta có một hệ sinh thái tăng trưởng AI toàn diện và công bằng, đồng thời thúc đẩy sự phát triển và áp dụng AI có đạo đức. Mặc dù vấn đề là sâu sắc và những thách thức công nghệ hiện tại đảm bảo rằng tương lai AI hiện đang nằm trong tay một số ít, nhưng có rất ít yếu tố hỗ trợ chính cho một tương lai toàn diện và công bằng.
Đạo đức và tiêu chuẩn của AI: Giống như ba nguyên tắc về robot do Asimov đưa ra, các quốc gia cần áp dụng một tiêu chuẩn tối thiểu chung và một cách tiếp cận thống nhất về đạo đức. Mặc dù mỗi quốc gia có thể có khuôn khổ chính sách và quy định khác nhau, nhưng các tiêu chuẩn tối thiểu chung sẽ đảm bảo rằng, các yếu tố đạo đức cần thiết không bị bỏ qua.
Ngân hàng dữ liệu mở và đã được xác minh: Ngân hàng dữ liệu mở do chính phủ và các đối tác doanh nghiệp đóng góp trong mô hình bảo vệ quyền riêng tư, khuyến khích chủ sở hữu dữ liệu và người được ủy thác dữ liệu hợp tác để đôi bên cùng có lợi, và mang đến lợi ích cho tất cả các bên liên quan. Các ngân hàng dữ liệu này nên được đánh giá bởi những người xây dựng hệ thống có nhận thức và hiểu biết sâu sắc về chúng, đồng thời tạo ra những đổi mới.
Tài năng mở: Khuyến khích các viện nghiên cứu và các cơ sở đào tạo/đào tạo lại nhân tài, có sự hỗ trợ hoặc trợ cấp của chính phủ và cung cấp trợ cấp R&D để mở hoặc tham gia các công ty khởi nghiệp thông qua mô hình khép kín mạo hiểm. Điều này sẽ đảm bảo rằng, các tài năng trẻ sẽ hướng tới các hệ sinh thái đổi mới.
Miền: Đổi mới mở được thúc đẩy bởi các cố vấn miền (domain) từ khắp nơi trên toàn cầu, được hỗ trợ bởi các hiệp hội, chính phủ và học giả với quan điểm thúc đẩy các tiêu chuẩn AI trong các lĩnh vực.
Nghiên cứu: Kích hoạt các mô hình nghiên cứu mở và nối mạng được tài trợ bởi các hợp tác xã lớn, quỹ hoặc các công ty lớn như một phần của trách nhiệm xã hội của doanh nghiệp và được tất cả các bên liên quan mở cho phép đồng sáng tạo đổi mới. Điều này sẽ đảm bảo rằng, sự đổi mới sẽ lan tỏa đồng đều hơn với chất lượng đầu ra nghiên cứu tốt hơn.
Vốn: Các quỹ đầu tư mạo hiểm đổi mới AI và quỹ nợ được chính phủ tài trợ một phần và được hỗ trợ bởi các doanh nghiệp với cơ cấu giảm thuế để thu hút người góp vốn, sẽ tạo ra nguồn vốn khả dụng đồng đều hơn.
Con đường dẫn đến thời đại AI rất gian nan và trắc trở. Chúng ta sẽ phát triển trong một xã hội như thế nào phụ thuộc nhiều vào các nhà đổi mới và các nhà hoạch định chính sách. Môi trường được quản lý quá khắc nghiệt có thể giết chết sự đổi mới. Nhưng một hệ sinh thái không được kiểm soát và không thể kiểm soát có thể tạo ra những thay đổi quá cấp tiến và quá nhanh và chúng ta khó có thể thích nghi.
Chú thích ảnh: Làn sóng AI và nền kinh tế trải nghiệm [7]
Chú thích:
7. Working Group on the Responsible Development, Use and Governance of AI, “Innovation & Commercialization Working Group Report”, The Global Partnership on Artificial Intelligence Montreal Summit, 11/2020, https://gpai.ai/projects/innovation-andcommercialization/gpai-innovation-commercialization-wg-report-november-2020.pdf
8. Will Douglas Heaven, “OpenAI’s new language generator GPT-3 is shockingly good— and completely mindless”, MIT Technology Review, 20/7/2020, https://www. technologyreview.com/2020/07/20/1005454/openai-machine-learning-language-generatorgpt-3-nlp/
9. Tom B. Brown et al., “Language Models are Few-Shot Learners”, ArXiv abs/2005.14165 (2020), https://arxiv.org/pdf/2005.14165.pdf
10. Ian Sample, “‘We can’t compete’: why universities are losing their best AI scientists”, The Guardian, 1/11/2017, https://www.theguardian.com/science/2017/nov/01/cantcompete-universities-losing-best-ai-scientists
11. NITI Aayog, Data Empowerment And Protection Architecture Draft for Discussion, 8/2020, https://www.niti.gov.in/sites/default/files/2020-09/DEPA-Book.pdf .
Tác giả: Umakant Soni, Đồng sáng lập & CEO ArtPark (AI & Robotics Technilogy Park), Ấn Độ
Trung tâm Nghiên cứu Ấn Độ
Nguồn: https://www.orfonline.org/wp-content/uploads/2021/10/Regulating-Cyberspace.pdf
- Share
- Copy
- Comment( 0 )
Cùng chuyên mục