Học viện Chính trị quốc gia Hồ Chí Minh

Trung tâm Nghiên cứu Ấn Độ

Lựa chọn của Ấn Độ trước sự bùng nổ của AI tạo sinh

Lựa chọn của Ấn Độ trước sự bùng nổ của AI tạo sinh

Sự phấn khích lớn - một số người có thể gọi là sự cường điệu - xung quanh AI tạo sinh, bắt đầu với sự ra đời của ChatGPT của OpenAI vào cuối năm 2022, vẫn tiếp tục diễn ra.

11:00 30-04-2025 Trung tâm Nghiên cứu Ấn Độ

Đã có một vài sự sụt giảm gần đây, đầu tiên là thông báo về sự cạnh tranh từ Deepseek của Trung Quốc và sau đó là sự suy giảm chung của NASDAQ và7 công ty công nghệ trong nhóm Magnificent Seven (gồm Apple, Microsoft, Alphabet, Amazon, Nvidia, Meta, Tesla), thậm chí trước cả cơn bão về thuế quan.

Định giá thị trường vẫn rất lớn. OpenAI được định giá 300 tỷ đô la Mỹ trong một vòng gọi vốn, trong khi xAI (công ty của Elon Musk đã sản xuất Grok bằng dữ liệu thời gian thực từ X, (trước đây là Twitter) được định giá 80 tỷ đô la Mỹ.

Mặt khác, có những câu hỏi về sở hữu trí tuệ: ChatGPT đã sao chép giao diện thương hiệu của hãng phim hoạt hình Nhật Bản Ghibli, không rõ liệu có được cấp phép quyền sở hữu trí tuệ hay không. Ngoài ra còn có một kết cục đen tối: những bức ảnh bạn Ghibli hóa trở thành tài sản của OpenAI.

Có ba câu hỏi rộng và thú vị: thứ nhất, liệu chúng ta có đang chứng kiến ​​một sự đổi mới thực sự, thay đổi cuộc sống một cách ngoạn mục như sự ra đời của điện hay không; thứ hai, lợi nhuận đầu tư đáng kể sẽ đến từ đâu; và thứ ba, vai trò hiện tại và tương lai của Ấn Độ có thể đòi hỏi điều gì, đặc biệt là trong bối cảnh các thông báo về sứ mệnh AI quốc gia gần đây.

1. AI tạo sinh có thực sự là sáng kiến ​​mang tính đột phá không?

Trước tiên, chúng ta hãy thảo luận về thuật ngữ. AI truyền thống và Học máy hiện được gọi là AI dự đoán. Phương pháp này sử dụng lượng lớn dữ liệu số để xác định các mẫu. Những tiến bộ đáng kể trong những năm gần đây, chẳng hạn như AlphaFold, bắt nguồn từ lĩnh vực này. Nó kiểm tra dữ liệu lịch sử để dự đoán kết quả hoặc xu hướng trong tương lai. Các mô hình thống kê và thuật toán học máy dự đoán các sự kiện như hành vi của khách hàng, xu hướng thị trường hoặc lỗi thiết bị.

Ngược lại, AI tạo sinh tập trung vào việc tạo nội dung hoặc dữ liệu mới, chẳng hạn như hình ảnh, văn bản, nhạc hoặc thậm chí là mã phần mềm. Nó được thiết kế để tạo ra các đầu ra mới dựa trên các mẫu học được từ dữ liệu hiện có, chủ yếu là dữ liệu phi cấu trúc như văn bản.

AI dự đoán đã mang lại những kết quả có giá trị, cải thiện mọi thứ từ lập kế hoạch kiểm kê bán lẻ đến các diễn giải X-quang chính xác hơn. Thách thức đối với AI tạo sinh là nó vẫn chưa có ứng dụng nổi bật trong doanh nghiệp.

Hiện tại, cũng không có trường hợp sử dụng rõ ràng nào cho AI tạo sinh cho B2C (doanh nghiệp tới khách hàng). Mặc dù AI tạo sinh có khả năng sớm trở nên phổ biến như email và hội nghị truyền hình, nhưng ít người sẵn sàng trả tiền cho những sản phẩm này. Phần lớn, các nhà cung cấp lớn đang sử dụng AI tạo sinh để "nâng cao trải nghiệm của người dùng". Sau khi hoàn thành việc này, họ khá sẵn lòng phát hành mã của mình cho công chúng. Có một trường hợp sử dụng tiềm năng cho các công ty phần mềm để hỗ trợ các doanh nghiệp cải thiện quy trình nội bộ của họ bằng AI; các công ty này sẽ hoạt động như các nhà tư vấn nhưng có tác động hữu hình đến hoạt động.

Có một niềm tin rằng "các tác nhân" dựa trên AI có thể cách mạng hóa quy trình làm việc và điện toán doanh nghiệp. Tương tự như vậy, "mã hóa rung động" ngày càng phổ biến có thể cho phép người dùng không chuyên tạo phần mềm bằng các câu lệnh tiếng Anh đơn giản. Tất cả những điều này vẫn còn phải chờ xem trong tương lai phát triển ra sao. Do đó, tại thời điểm này, AI không phải là một sáng kiến ​​làm rung chuyển trái đất như điện hoặc Internet.

2. Điều gì đằng sau sự trỗi dậy nhanh chóng của AI tạo sinh?

Một số yếu tố đã thiết lập cơ sở cho sự phổ biến của AI tạo sinh. Ngoài những yếu tố được đề cập dưới đây, còn có sự theo đuổi liên tục của "hào kinh tế" (lợi thế cạnh tranh), sự phát triển của chu kỳ cường điệu như một khía cạnh thường xuyên của ngành công nghệ và việc sử dụng "tiêu chuẩn" như một vũ khí cạnh tranh.

Những đột phá về mặt kỹ thuật cho phép giao diện người dùng tốt hơn

Từ khi ChatGPT lần đầu tiên xuất hiện vào cuối năm 2022, sự tiếp nhận nhanh chóng của AI tạo sinh chủ yếu là do trải nghiệm tuyệt vời của người dùng. Ngoài ra, AI tạo sinh phản hồi cho các câu hỏi một cách nhanh chóng và với sự tự tin ấn tượng, mặc dù người dùng biết rằng những phản hồi này là thống kê thiếu kiểm chứng và có thể dễ mắc lỗi (ảo giác).

Ví dụ về Eliza, một chatbot AI đầu tiên từ những năm 1960, rất đáng để tham khảo. Eliza hoạt động như một nhà trị liệu tâm lý - diễn đạt lại những gì người dùng nói thành các câu hỏi hoặc lời nhắc để khuyến khích giải thích thêm. Phương pháp này đã tạo ra trải nghiệm trò chuyện đáng ngạc nhiên mặc dù nó rất đơn giản. Mọi người không chỉ tương tác với một chương trình mà còn lấp đầy khoảng trống bằng tính nhân văn, khiến chương trình trở nên gần gũi và có khả năng phản hồi.

Eliza cũng tập trung vào cuộc trò chuyện, tăng cường ảo giác về một cuộc trao đổi một-một với một người lắng nghe chu đáo. Khi mã nội bộ không cho phép tạo ra câu trả lời hợp lý, chương trình chỉ trả lời bằng câu "Hãy cho tôi biết thêm về..." (chủ đề cuối cùng). Chương trình không làm người dùng ngập trong các tùy chọn hoặc thuật ngữ kỹ thuật mà chỉ "lắng nghe" và trả lời, điều này mang lại cảm giác trực quan và tự nhiên.

Tương tự như vậy đối với các chatbot ngày nay, tạo ra ấn tượng (nhầm lẫn) rằng một người vô cùng đồng cảm đang ở đầu bên kia của cuộc trò chuyện. Thật không may, sự nhân cách hóa này đôi khi dẫn đến hành vi gây nghiện, dẫn đến trầm cảm, bệnh tâm thần và thậm chí là tự tử.

Điện ảnh phát triển nhờ "sự hoài nghi tự nguyện" của người xem. Tương tự như vậy, AI tạo sinh đã bùng nổ với những câu trả lời đáng tin cậy cho những câu hỏi phổ biến và không có gì ngạc nhiên khi nó trở thành công nghệ có tốc độ áp dụng nhanh nhất từ ​​trước đến nay.

Nghịch lý cơn sốt đi tìm vàng

Trong cơn sốt đi tìm vàng năm 1849, những người thợ mỏ đổ xô đến California, mơ ước làm giàu. Tuy nhiên, thực tế lại khắc nghiệt - hầu hết chỉ hòa vốn, trong khi của cải thực sự tích lũy trong tay những người trung gian. Những người này bao gồm các thương gia bán cuốc, xẻng, chảo, quần jean và đồ dùng, cũng như những người xây dựng khu ổ chuột và điều hành hộp đêm. Họ phát triển mạnh vì họ cung cấp các công cụ và cơ sở hạ tầng thiết yếu mà mọi thợ mỏ cần, bất kể những người thợ mỏ đó có tìm thấy vàng hay không. Nhu cầu có thể dự đoán được và lan rộng, và những người trung gian không phải chịu những rủi ro giống như những người tìm kiếm vàng đang đào vàng để kiếm lời không chắc chắn.

Một động lực tương tự đang diễn ra với AI tạo sinh ngày nay. Các công ty phát triển và bán các giải pháp AI cho doanh nghiệp - chẳng hạn như các công ty cung cấp chatbot tùy chỉnh, trình tạo nội dung hoặc nền tảng AI dành riêng cho ngành - cũng giống như những người thợ mỏ. Họ đang theo đuổi "vàng" của việc áp dụng rộng rãi và các trường hợp sử dụng mang tính chuyển đổi, nhưng thành công của họ còn lâu mới được đảm bảo. Phát triển các mô hình AI tốn kém, cạnh tranh và rủi ro; đòi hỏi đầu tư đáng kể vào nhân tài, dữ liệu và sức mạnh tính toán, và lợi nhuận phụ thuộc vào sự chấp nhận và phân biệt của thị trường trong bối cảnh đông đúc.

Trong khi đó, các nhà sản xuất chip như Nvidia và những gã khổng lồ điện toán đám mây như Amazon (AWS), Microsoft (Azure) và Google (GCP) đóng vai trò là những trung gian hiện đại. Mọi công ty AI, từ các công ty khởi nghiệp đến các ông lớn công nghệ, đều phụ thuộc vào các công cụ này. Ví dụ, chip của Nvidia đại diện cho tiêu chuẩn vàng để đào tạo các mô hình ngôn ngữ lớn (LLM). Tương tự như vậy, các nhà cung cấp đám mây cung cấp các tài nguyên lưu trữ, mạng và điện toán cần thiết để làm cho việc phát triển và triển khai AI khả thi ở quy mô lớn.

Các bên trung gian phát triển mạnh vì sản phẩm của họ là thiết yếu và nguồn doanh thu của họ ổn định hơn. Ngược lại, các công ty AI doanh nghiệp phải đối mặt với sự cạnh tranh gay gắt và biên lợi nhuận không thể đoán trước. Họ đang trông cậy vào việc cung cấp giá trị cho người dùng cuối, nhưng họ thường chỉ cần một cuộc chiến đổi mới hoặc định giá là có thể bị hạ giá. Các bên trung gian, với vị thế đã được thiết lập và cơ sở khách hàng rộng lớn, nắm giữ phần lớn giá trị mà không phải đối mặt với những rủi ro tương tự. Cũng giống như Levi Strauss đã tạo ra một đế chế denim (thời trang vải bò) trong khi nhiều thợ mỏ thất bại, Nvidia và những gã khổng lồ đám mây kiếm được hàng tỷ đô la trong khi các công ty khởi nghiệp AI phải vật lộn để tồn tại.

Tầm nhìn chiến lược, tái tạo và kỹ năng cạnh tranh của Microsoft

Tầm nhìn chiến lược của Microsoft đóng vai trò then chốt trong việc mở rộng AI tạo sinh. Bằng cách tận dụng mối quan hệ đối tác với OpenAI, công ty đã tạo ra một thị trường hoàn toàn mới. Do đó, Microsoft là công ty duy nhất lọt vào top 10 về vốn hóa thị trường vào năm 2001 và 2025.

Trong thời kỳ trước đó, công ty đã sử dụng quyền sở hữu chung của mình đối với nhượng quyền thương mại Wintel thống trị để thiết lập vị thế này. Sau đó, khi chuyển từ máy tính để bàn sang điện toán đám mây, công ty đã định vị mình trong số ba nền tảng điện toán đám mây hàng đầu, cùng với AWS của Amazon (người tiên phong) và Google Cloud (kém xa).

Như đã thảo luận, điện toán đám mây và chip đại diện cho các khía cạnh sinh lợi nhất của hệ sinh thái AI tạo sinh. Theo một nghĩa nào đó, điều này phản ánh sự tái tạo của thế độc quyền Wintel. Microsoft đã định vị mình một cách có lợi bằng cách hợp tác với OpenAI và tận dụng các khách hàng doanh nghiệp đã cam kết sử dụng Windows, Office, Teams và các sản phẩm khác.

Ngoài ra còn có một câu chuyện hấp dẫn về sự cạnh tranh của các công ty, nơi Microsoft đã đảo ngược tình thế trước Google trong cuộc cạnh tranh kéo dài hàng thập kỷ của họ. Thật trớ trêu khi Google, thông qua công ty con DeepMind (ví dụ: AlphaFold và AlphaGo) và phát minh ra công nghệ Transformer, lại là công ty tiên phong trong cả AI dự đoán và AI tạo sinh. Ngoài ra, công ty đã thành công trong việc tạo ra hình thức nhượng quyền công cụ tìm kiếm.

Tuy nhiên, Microsoft đã thực sự định vị mình là công ty dẫn đầu trong lĩnh vực AI. Mảng tìm kiếm cốt lõi của Google và hoạt động quảng cáo trị giá 200 tỷ đô la Mỹ hiện đang phải đối mặt với nguy cơ khi người dùng từ bỏ các dịch vụ của công ty để chuyển sang các công cụ tìm kiếm AI mới như Perplexity hoặc Grok.

Thách thức từ Trung Quốc

Sự ra đời của các sản phẩm AI tạo sinh của Trung Quốc như DeepSeek đã định hình lại đáng kể thị trường AI vào năm 2025, tạo ra sự kết hợp giữa đổi mới, cạnh tranh và đột phá đã tạo nên tiếng vang trên toàn cầu.

Đầu tiên, có DeepSeek, được tuyên bố là hiệu quả về mặt chi phí, mặc dù một số chuyên gia tỏ ra hoài nghi về khẳng định của họ về sự cải thiện đáng kể. Các báo cáo cho thấy DeepSeek-V3 đã được đào tạo với chi phí dưới 6 triệu đô la Mỹ bằng cách sử dụng ít chip Nvidia hơn, kém tiên tiến hơn (ví dụ: H800) so với hàng tỷ đô la mà các công ty Mỹ chi. Hiệu quả này xuất phát từ các kỹ thuật như tính thưa thớt trong đào tạo mô hình (chỉ tập trung vào các tham số có liên quan) và nén dữ liệu, cho phép hiệu suất cao với nhu cầu tài nguyên thấp hơn. Điều này đã hạ thấp rào cản gia nhập.

Thứ hai, có động lực nguồn mở. Không giống như các mô hình độc quyền của OpenAI, DeepSeek đã áp dụng phương pháp nguồn mở, tương tự như GEMINI của Google và LLaMA của Facebook. Những gã khổng lồ công nghệ Trung Quốc như Alibaba và Tencent cũng đã mã nguồn mở các mô hình của họ (ví dụ: Qwen 2.5, Hunyuan), tạo ra một "khoảnh khắc Android" cho AI. Các giải pháp thay thế của Trung Quốc này đã làm xói mòn sức mạnh định giá của các công ty phương Tây.

Thứ ba, đã có những gợn sóng địa chính trị: Mỹ ủng hộ đầu tư mới, chẳng hạn như sáng kiến ​​Stargate trị giá 500 tỷ đô la Mỹ. Mối lo ngại nảy sinh liên quan đến các sản phẩm của Trung Quốc thu thập dữ liệu từ nhiều nguồn khác nhau, đặc biệt là khi chính phủ Trung Quốc bắt đầu coi các công ty AI của mình là "nhà vô địch quốc gia" xứng đáng được hỗ trợ.

Những người chơi Trung Quốc đã thay đổi luật chơi: không còn chỉ là về các khoản đầu tư lớn vào hàng tỷ đô la vào các hệ thống độc quyền, như đã thấy trong mô hình của Mỹ, mà thay vào đó là hấp dẫn về tiềm năng tạo ra LLM bằng cách sử dụng các sản phẩm nguồn mở của Trung Quốc.

3. Con đường của Ấn Độ để có vai trò trong lĩnh vực này

Mục tiêu của AI Ấn Độ

Chính phủ và xã hội Ấn Độ cần hiểu rõ cách họ muốn định vị mình trong phạm vi rộng lớn của AI tạo sinh. Trọng tâm nên là tận dụng khả năng của AI vì lợi ích của Ấn Độ; do đó, việc phấn đấu xây dựng các sản phẩm cạnh tranh toàn cầu với các công ty dẫn đầu thị trường hiện tại sẽ là không thực tế.

Cần có hai bước thiết yếu để phát triển các sản phẩm AI đáp ứng nhu cầu của xã hội Ấn Độ: loại bỏ thiên vị và bản địa hóa. Mỗi bước này được mô tả ngắn gọn.

Các mô hình nguồn mở hiện tại, ngay cả đối với các vấn đề liên quan đến Ấn Độ, chủ yếu được đào tạo trên các nguồn từ bên ngoài quốc gia. Hai ví dụ sẽ minh họa cho nhược điểm của điều này: (1) Nếu Deep Seek được hỏi một câu hỏi về Arunachal Pradesh, thì nó trả lời rằng không có nơi nào như vậy tồn tại. Điều này là do Deep Seek, một sản phẩm của Trung Quốc, không thừa nhận rằng Arunachal Pradesh là một phần của Ấn Độ. (2) Nếu bất kỳ mô hình phương Tây nào được hỏi về RSS, thì câu trả lời có thể sẽ là RSS là một tổ chức khủng bố của người Hindu. Điều này là do các mô hình này được đào tạo trên các nguồn như Wikipedia, vốn thù địch không thể cứu vãn đối với Ấn Độ.

Việc loại bỏ những sự bóp méo như vậy được gọi là "khử thiên vị". Có thể quá tham vọng khi tin rằng chúng ta có thể ngăn những cá nhân bên ngoài Ấn Độ nhận được câu trả lời bị bóp méo cho một truy vấn. Tuy nhiên, ít nhất, chúng ta có thể đảm bảo một công cụ truy vấn thay thế cung cấp thông tin chính xác hơn.

Trong nhiều thập kỷ, đã có một xu hướng đáng chú ý là người phương Tây chiếm đoạt tài sản trí tuệ của Ấn Độ. Có rất nhiều ví dụ: sức mạnh chữa bệnh của nghệ, gạo Basmati, yoga, pranayama, v.v. Một quốc gia mạnh mẽ có lòng tự trọng nên đặt mục tiêu ngăn chặn các vụ trộm cắp trong tương lai và khắc phục các vụ trộm cắp trong quá khứ.

Ngoài ra, LLM có thể bắt đầu hết dữ liệu đào tạo, điều này có thể khiến họ phải dựa vào "dữ liệu tổng hợp" do AI hoặc các quy trình nhân tạo khác tạo ra. Điều này gây ra một số vấn đề: sự khuếch đại của các thiên vị hiện có trong các mô hình, thiếu cơ sở thực tế và khả năng "sụp đổ mô hình", khi genAI bắt đầu tạo ra điều vô nghĩa. Do đó, các công ty genAI sẽ cần tìm kiếm dữ liệu đào tạo thực tế mới.

Đặc biệt, Hệ thống tri thức Ấn Độ (IKS) truyền thống chứa rất nhiều tài liệu hiện có thể được khai thác và sử dụng bởi các mô hình ngôn ngữ. Điều cần thiết là phải mã hóa IKS theo một định dạng thiết lập rõ ràng nguồn gốc của kiến ​​thức. Đổi lại, điều này đòi hỏi phải kết hợp IKS vào mô hình AI tạo sinh của Ấn Độ, một quy trình được gọi là “bản địa hóa”.

Cụ thể, việc xây dựng các LLM chuyên về IKS sẽ là điều đáng mong muốn. Ví dụ, có thể có một LLM được đào tạo gần như hoàn toàn về Ashtadyayi của Panini, mà các nhà nghiên cứu có thể sử dụng để khai thác chiều sâu của kiệt tác đó và thu thập những hiểu biết sâu sắc. Trong một ví dụ khác, việc giải mã mật mã gần đây của chữ viết Indus-Sarasvati có thể đã được đẩy nhanh nếu có một LLM tập trung hẹp vào chủ đề này. Các bước để đạt được cả hai mục tiêu được mô tả thêm bên dưới.

Các cách tiếp cận để xây dựng giải pháp AI của Ấn Độ

Nói chung, có hai cách tiếp cận có thể để xây dựng mô hình ngôn ngữ là cơ bản và tinh chỉnh (cụm từ này không được sử dụng rộng rãi). Chúng tôi thảo luận về ưu điểm và nhược điểm của từng cách tiếp cận, đặc biệt nhấn mạnh vào kịch bản của Ấn Độ.

Mô hình về cơ bản là do những người xây dựng mô hình tạo ra nhóm mã thông báo của riêng họ từ nhiều nguồn dữ liệu khác nhau (công khai, độc quyền hoặc cả hai), chọn kiến ​​trúc mô hình, sau đó đào tạo mô hình bằng cách chọn "trọng số" của mô hình. Để tạo ra một ngữ liệu đủ phong phú để tạo ra các mô hình ngôn ngữ thực tế sẽ cần từ 10 nghìn tỷ đến 100 nghìn tỷ mã thông báo và từ 500 tỷ đến một nghìn tỷ tham số.

Các mô hình hiện tại như GEMINI, LLaMA, ChatGPT4 và Deep Seek đều nằm trong phạm vi này. Tuy nhiên, chi phí sẽ cao hơn đáng kể so với việc phát triển các mô hình được tinh chỉnh. Nhiệm vụ IndiaAI hình dung khoản chi là 2000 crore Rupee, được phân bổ cho 6 đến 10 dự án (hoặc 200 đến 300 crore Rupee cho mỗi dự án), với mốc thời gian phát triển từ sáu đến mười hai tháng cho các mô hình nền tảng. Theo quan điểm của tác giả, thật không thực tế khi mong đợi bất kỳ mô hình nền tảng có tác động nào được phát triển với mức tài trợ này.

Để xây dựng mô hình được tinh chỉnh, những người xây dựng bắt đầu với mô hình nguồn mở đáp ứng tốt nhất các yêu cầu của họ và sau đó điều chỉnh trọng số để mô hình hoạt động tốt trên tập dữ liệu bổ sung của riêng họ, có thể là độc quyền. Điều quan trọng là phải đảm bảo rằng khi điều chỉnh trọng số, hiệu suất của ngữ liệu được sử dụng để đào tạo mô hình ban đầu không bị suy giảm.

Điều này rất khó khăn vì trong khi trọng số của một mô hình nguồn mở có sẵn miễn phí, thì ngữ liệu được sử dụng để suy ra các trọng số này thì không. May mắn thay, một ý tưởng đã có từ nhiều thập kỷ trước từ thống kê đã mang lại giải pháp cho vấn đề này. Nếu kích thước của dữ liệu bổ sung được sử dụng để tinh chỉnh nhỏ hơn nhiều bậc độ lớn so với ngữ liệu gốc, thì có thể sử dụng một phương pháp được gọi là "Điều chỉnh thứ hạng thấp (LoRA)". Các mô hình nguồn mở hiện có ước tính dựa trên 100 nghìn tỷ (10^14) mã thông báo. Bất kỳ dữ liệu Ấn Độ bổ sung nào cũng sẽ không vượt quá một nghìn tỷ (10^12) mã thông báo hoặc 1% ngữ liệu gốc (chưa biết). Điều này cho thấy rằng tinh chỉnh sẽ hiệu quả trong bối cảnh Ấn Độ.

Việc phát triển một mô hình tinh chỉnh, chất lượng cao sẽ rẻ hơn đáng kể so với việc tạo ra một mô hình nền tảng có ý nghĩa. Điều này là do bước đầu tiên sẽ liên quan đến một mô hình nguồn mở đã trải qua quá trình phát triển và thử nghiệm nghiêm ngặt. Tuy nhiên, theo các quy tắc của cộng đồng phần mềm, bất kỳ mô hình nào được xây dựng dựa trên mô hình nguồn mở đều phải được đưa trở lại thế giới nguồn mở. Điều này không phải là bất lợi đối với Ấn Độ và thậm chí có thể là một lợi thế vì nó có thể khiến Ấn Độ được coi là một bên tham gia quan trọng trong lĩnh vực này. Ngược lại, việc phát triển nhiều mô hình tương đối nhỏ, chỉ được phân biệt bởi bản chất nền tảng của chúng, sẽ không cải thiện cách phần còn lại của thế giới nhìn nhận Ấn Độ.

Các bộ kỹ năng cần thiết là gì?

Để xây dựng ngay cả một mô hình được tinh chỉnh, cần có hai bộ kỹ năng riêng biệt: thuật toán và kỹ thuật phần mềm. Hầu hết các thuật toán được sử dụng trong đào tạo LLM đều có sẵn ở dạng "mã giả" trong tài liệu mở. Do đó, việc chuyển đổi mã giả này thành mã hoạt động tương đối đơn giản (giả sử người ta quen thuộc với tài liệu, nhưng không phải lúc nào cũng là một giả định hợp lệ), thường là bằng Python.

Không cần thêm kỹ thuật phần mềm nào cho các mô hình tương đối nhỏ, chẳng hạn như các mô hình có từ 5 đến 20 tỷ tham số. Các môi trường như PyTorch xử lý các vấn đề như song song hóa và phân bổ bộ nhớ. Các kỹ sư tham gia vào dự án này rất mong muốn bắt đầu bằng một mô hình nguồn mở có quy mô này và thiết lập các giải pháp theo chương trình để tinh chỉnh, bao gồm khử độ lệch và bản địa hóa. Cách tiếp cận này sẽ giúp họ hiểu sâu hơn về các vấn đề thuật toán đang diễn ra.

Tuy nhiên, không có mô hình có ý nghĩa nào lại nhỏ như vậy. Các mô hình mà chúng ta sẽ làm việc, ngay cả khi điểm khởi đầu là mã nguồn mở, sẽ có tối thiểu là nửa nghìn tỷ tham số. Việc mở rộng các giải pháp được đề cập ở đoạn trước lên quy mô này sẽ đòi hỏi phải hiểu biết về kỹ thuật phần mềm, bao gồm tối ưu hóa và kiến ​​thức thuật toán.

Đây là bí quyết ngầm: "kiến thức ngầm" thường không được ghi lại ở bất kỳ đâu. Thông thường, chỉ những người "đã từng trải qua điều đó" mới biết những khía cạnh này. Lý tưởng nhất là chúng ta nên cố gắng thu hút ít nhất một vài người đã từng làm việc trên các mô hình mã nguồn mở lớn hiện có. Những người này có thể đào tạo những người khác.

Ngân sách và khung thời gian

Một bằng chứng về khái niệm giai đoạn 1 dựa trên mô hình mã nguồn mở gồm khoảng 20 tỷ tham số đạt được cả khả năng khử sai lệch và bản địa hóa có thể được chuẩn bị trong sáu đến chín tháng và sẽ tốn khoảng 600 crore Rupee (1845 tỷ VND). Giai đoạn 2, phiên bản có đầy đủ chức năng, sẽ hướng tới một giải pháp hoàn chỉnh và sẽ mất khoảng chín đến mười hai tháng, với ngân sách khoảng 1200 crore Rupee (3700 tỷ VND).

Tuy nhiên, sáng kiến ​​này không thể tiếp tục do chính phủ điều hành; khu vực tư nhân cũng phải đóng góp. Ban đầu, điều này có thể diễn ra thông qua các dự án thí điểm sử dụng quỹ Trách nhiệm xã hội của doanh nghiệp (CSR). Tuy nhiên, trong tương lai, hoạt động phát triển LLM toàn diện, đào tạo, trung tâm dữ liệu và tiếp thị phải đến từ khu vực tư nhân ở quy mô lớn hơn đáng kể so với khoản đầu tư ban đầu của khu vực công. Cần có các ưu đãi có mục tiêu để kích thích sự tham gia của khu vực tư nhân.

Ứng dụng tiềm năng trong xã hội Ấn Độ

Mặc dù có nhiều cách mà đầu tư AI tạo sinh có thể mang lại lợi ích cho xã hội Ấn Độ, chúng tôi sẽ tập trung vào một lĩnh vực: giáo dục. Vẫn còn những lo ngại về trình độ học vấn kém của học sinh Ấn Độ, đặc biệt là trong các bài kiểm tra toàn cầu chuẩn hóa như PISA, trong đó Ấn Độ đã ngừng tham gia do điểm số ảm đạm.

Một yếu tố quan trọng để đạt được thành công có thể là giáo dục bằng tiếng mẹ đẻ ở cấp tiểu học và trung học, đặc biệt là trong các môn khoa học khó. Các quốc gia có điểm PISA cao, chẳng hạn như Phần Lan, Nhật Bản, Hàn Quốc và Đức, đã triển khai cách tiếp cận này. Cũng có thể có một lợi thế về nhận thức: bạn nắm bắt các khái niệm thay vì vật lộn với các từ tiếng Anh không quen thuộc.

Bằng cách sử dụng LLM được đào tạo với các nguồn phù hợp, chúng tôi có thể cung cấp bản dịch chất lượng cao sang các ngôn ngữ Ấn Độ, tạo điều kiện thuận lợi cho giáo dục tiểu học và trung học cơ sở dựa trên tiếng mẹ đẻ. Nhiều quốc gia đã chứng minh rằng đây không phải là bất lợi cho hoạt động R&D trong tương lai. Ngoài ra, trong môi trường mà Internet và phương tiện truyền thông xã hội dẫn đến việc mất bản sắc gốc, điều này có thể giúp sinh viên duy trì một nền tảng văn hóa nhất định.

Một số người cho rằng giáo dục đại học chủ yếu nên bằng tiếng Anh, nhưng điều này cũng có thể được quản lý nếu LLM cung cấp dịch vụ dịch thuật bài giảng theo thời gian thực, cho phép sinh viên nghe bằng bất kỳ ngôn ngữ nào họ thích. Một lợi ích phụ đáng kể của cách tiếp cận này là khả năng thực hiện dịch đồng thời giữa bất kỳ ngôn ngữ Ấn Độ nào, giúp giao tiếp hàng ngày dễ dàng hơn nhiều và giảm hiệu quả một số xung đột ngôn ngữ đang diễn ra.

Kết luận

AI tạo sinh sẽ tồn tại, bất kể có khuyết điểm hay không. Chính quyền nhà nước và khu vực tư nhân Ấn Độ phải tận dụng sự hiện diện của AI và tham gia theo những cách không trực tiếp đối đầu với các nhà lãnh đạo thị trường chi tiêu hoang phí của Mỹ và Trung Quốc. Có những sáng kiến ​​đột phá/đi tắt đón đầu hoặc mang tính đột phá có thể tạo ra giá trị đáng kể cho xã hội Ấn Độ bằng cách cải thiện giáo dục, nuôi dưỡng và bảo vệ hệ thống tri thức Ấn Độ và tạo điều kiện thuận lợi cho giao tiếp đa ngôn ngữ.

Source:

Viết bình luận

Bình luận

Cùng chuyên mục