editor 1 năm trước

OpenAI công bố “AI agent” và Deep Research: Kỷ nguyên mới của trí tuệ nhân tạo

Sam Altman, nhà sáng lập OpenAI, vừa chia sẻ tại Tokyo về tầm nhìn mới cho trí tuệ nhân tạo (AI), đặc biệt xoay quanh “AI agent” và công cụ Deep Research. Bước tiến này hứa hẹn sẽ tạo nền tảng đột phá, đánh dấu kỷ nguyên AI tiếp theo.

Hành Trình Tiến Về “Agent”: Khởi Nguồn Và Tầm Nhìn

OpenAI, dưới sự dẫn dắt của Sam Altman, đang bước vào giai đoạn mới của lĩnh vực AI với tham vọng vượt qua giới hạn “chatbot” truyền thống. Tầm nhìn này không chỉ dừng lại ở việc trò chuyện thông minh mà còn hướng đến xây dựng các “AI agent” – các “trợ lý số” có khả năng quan sát, tự ra quyết định và hành động thay cho con người.

Sam Altman khởi đầu buổi trò chuyện tại Tokyo bằng cách tóm lược ba bước nhảy vọt của OpenAI trong vòng vài năm qua. Từ GPT-3 (ra mắt 2020) đến ChatGPT (cuối 2022), mô hình GPT-4 (đầu 2023), và mới đây là O3 (thường gọi là “03 mini”). Tốc độ tiến bộ quá nhanh này được ông mô tả là “cú nhảy siêu tốc của những lần nâng cấp bán niên hoặc thậm chí hàng quý”:

“Nếu chúng ta có thể duy trì nhịp phát triển như hiện nay, mô hình AI sẽ sớm đạt đến mức gần với năng lực suy luận như con người – hoặc thậm chí hơn thế.”

1. Năm cấp độ AI và khởi đầu với ChatGPT

Altman chia AI thành 5 cấp độ (level) phát triển. Ông nhắc lại việc OpenAI đã tung ra chatbot ChatGPT, phiên bản dựa trên GPT-3.5 và sau đó là GPT-4, coi đó là cột mốc cấp độ 1 & 2. Ở hai cấp độ này, AI chủ yếu tương tác qua văn bản, phản hồi dựa trên mô hình ngôn ngữ khổng lồ, học từ kho dữ liệu Internet. Tuy nhiên, dù có những bước tiến ngoạn mục, phiên bản này chỉ mới “nghĩ kỹ hơn trước khi trả lời” chứ chưa thể tác động, hành động trong thế giới thực.

2. Vươn lên cấp độ 3: “AI agent”

Đây mới là “làn sóng kế tiếp” mà Altman tập trung chia sẻ. AI agent chính là cấp độ 3, nơi mô hình có thể quan sát, ra quyết định độc lập và “nhấp chuột” như con người trên máy tính. Người dùng chỉ cần đưa ra một tác vụ và AI sẽ tự tìm kiếm, tự xử lý trên trình duyệt, tự quản lý các bước trung gian.

Ông dẫn chứng một sản phẩm thử nghiệm mà OpenAI ra mắt gần đây tên là Operator – một dạng agent đầu tiên có thể lướt web, nhấp chuột, thực hiện thao tác y hệt người thật. Altman tin tưởng rằng đây sẽ là “chìa khóa” để AI chuyển từ “trả lời” sang “thực hiện”:

“Với chatGPT, bạn có thể nói về bất kỳ chủ đề nào. Nhưng với agent, bạn sẽ có thể ‘làm’ bất kỳ việc gì.”

Deep Research: Công Cụ “Tìm Hiểu Sâu” Cho Doanh Nghiệp

– Tính năng “lập luận nhiều bước” và dẫn chứng minh bạch

Song song với Agent, OpenAI cũng giới thiệu công cụ “Deep Research” – hệ thống cho phép AI thực hiện nhiệm vụ nghiên cứu chuyên sâu bằng cách tìm kiếm nhiều nguồn trên web, phân tích, trích xuất và sắp xếp các kết quả. Không còn phản hồi tức thì như chatbot, Deep Research hoạt động giống một chuyên viên nghiên cứu: tự lọc tài liệu, sắp xếp thông tin và sau một khoảng thời gian nhất định (có thể từ 30 phút đến 30 ngày), trả về bản báo cáo đầy đủ.

Khác biệt so với ChatGPT là Deep Research liệt kê rõ nguồn trích dẫn, minh bạch quá trình phân tích. Người dùng có thể xem công cụ này đã tìm gì, phân tích ra sao, và dẫn đến kết luận cuối cùng như thế nào. Với khả năng này, “Deep Research” được kỳ vọng giải quyết những bài toán lớn của doanh nghiệp:

“Đây là một công cụ mà chúng tôi tin rằng có thể xử lý một phần quan trọng khối lượng công việc trí óc toàn cầu, đặc biệt trong các lĩnh vực như tài chính, M&A, khoa học, luật… Về cơ bản, bạn có thể có cả ‘đội quân’ nghiên cứu viên AI chỉ trong vài cú nhấp chuột.”

– Ứng dụng cho doanh nghiệp: Từ Sales đến M&A

Để minh họa, nhóm của Altman mô phỏng việc dùng Deep Research trong phân tích một đối tác tiềm năng tại thị trường Nhật Bản. Công cụ sẽ tra cứu thông tin, đưa ra chiến lược kinh doanh, phân tích xu hướng truyền thông và đề xuất giải pháp hợp tác. Tất cả chỉ sau vài câu hỏi khai thác ban đầu.
Ngoài ra, Deep Research còn có thể làm việc trên những phân tích chuyên sâu như M&A (mua bán, sáp nhập), truy xuất dữ liệu ngành hẹp, hoặc đánh giá mô hình kinh doanh của công ty. Khả năng tổng hợp thông tin minh bạch, trích nguồn, tạo báo cáo dạng “table” hay “summary” cụ thể khiến công cụ này nổi trội hơn chatbot.

– Từ “nhanh gọn” sang “chi tiết”

Nếu ChatGPT trả lời ngay tức thì, đôi khi còn hạn chế hoặc thiếu dẫn chứng, thì Deep Research “cần thời gian” để đào sâu vấn đề. Trong buổi demo, Altman cho thấy cùng một câu hỏi về đối tác, ChatGPT cho ra câu trả lời ngắn gọn, chung chung, còn Deep Research xuất bản “báo cáo siêu chi tiết” với bảng so sánh, biểu đồ, trích dẫn, link nguồn tin để kiểm chứng.

Bước Đột Phá Về Hạ Tầng Tính Toán: Hợp Tác Với Softbank Và ARM

– Nhu cầu “siêu máy tính” và quy mô toàn cầu

Đi kèm tham vọng huấn luyện các mô hình AI siêu lớn là đòi hỏi hạ tầng tính toán khổng lồ. Sam Altman nhấn mạnh: “Mô hình càng thông minh, lợi ích mang lại càng lớn, nhưng đồng nghĩa phải đầu tư tài nguyên, chi phí khổng lồ.” Bởi thế, OpenAI đã công bố hợp tác cùng các đối tác như SoftBank, ARM để xây dựng những “siêu máy tính” hiệu suất cao và mở rộng quy mô máy chủ trên toàn cầu.

“Đối với AI, ‘nhiều hơn’ luôn ‘tốt hơn.’ Chúng tôi cần băng thông khổng lồ để huấn luyện, và người dùng cũng đòi hỏi tài nguyên lớn để chạy AI. Tốc độ tiến bộ hiện tại sẽ tiếp tục, miễn là hạ tầng đủ vững.”

SoftBank, trong buổi trò chuyện, cũng đề cập việc xây trung tâm dữ liệu lớn tại Nhật Bản để giảm độ trễ (latency) cho các tác vụ quan trọng, đảm bảo tôn trọng quy định về quyền riêng tư của quốc gia. Những dự án này hứa hẹn đẩy nhanh việc thương mại hóa AI cho doanh nghiệp Nhật Bản – từ tài chính, ngân hàng đến sản xuất, bán lẻ.

– Vai trò của ARM: “Nơi đâu có thiết bị, nơi đó có AI”

ARM – công ty sản xuất kiến trúc chip hàng đầu – cũng cho biết họ phát triển nền tảng tính toán tối ưu năng lượng, từ máy chủ quy mô lớn đến thiết bị di động hay ô tô. Với 300 tỷ con chip đã được xuất xưởng, ARM tự tin cung cấp “chìa khóa” cho kỷ nguyên AI nhúng ở khắp nơi:

“Chúng tôi hình dung một tương lai AI agent có thể giao tiếp với nhau, và mọi thiết bị – từ điện thoại, PC đến xe hơi, nhà thông minh – đều được tích hợp năng lực tính toán mạnh mẽ, sẵn sàng chạy mô hình AI.”

Tương Lai AI: Từ “Agent” Đến “Người Sáng Tạo” Và Cuộc Cách Mạng Trong Mọi Lĩnh Vực

Sam Altman nhấn mạnh lộ trình 5 cấp độ AI. Hiện tại, thế giới mới chạm đến cấp độ 3 (Agent). Ở tương lai gần, OpenAI muốn vượt lên cấp độ 4 (Innovator) – nơi AI không chỉ tổng hợp kiến thức sẵn có, mà còn phát minh, tạo lập tri thức mới. Cuộc trò chuyện cũng “hé lộ” những triển vọng lớn:

Y tế và nghiên cứu khoa học
Altman tin rằng AI có thể giúp “giải mã” những bí ẩn về ung thư, tìm phương thuốc mới hoặc hỗ trợ chẩn đoán chính xác hơn. Đây là giấc mơ “phổ cập y tế chất lượng cao” cho toàn cầu.
Robot và tự động hóa
Humanoid robot – robot hình người – được kỳ vọng xuất hiện phổ biến trong vài năm tới. Sự kết hợp giữa “bộ não AI” (có khả năng reasoning sâu) với “cơ thể” (robot cứng hoặc mềm) sẽ tạo ra những thay đổi chưa từng có. Altman dự đoán robot có thể thay con người làm việc nặng nhọc, nguy hiểm.
Giáo dục
Ban đầu, nhiều trường học tìm cách cấm ChatGPT. Nhưng sau vài tháng, hướng cấm đoán bị lật ngược: AI được đưa vào chương trình, hướng dẫn học sinh cách khai thác để học nhanh hơn, tư duy tốt hơn. Ai không sử dụng AI trong lớp có thể tụt hậu.
Tính nhân văn và cảm xúc
Một trong những điểm tranh luận là liệu AI có sở hữu cảm xúc không, hay chỉ mô phỏng? Altman cho rằng AI có thể trông như có cảm xúc, nhưng về bản chất, điều đó “phụ thuộc vào góc nhìn triết học.” Trong khi đó, nhiều chuyên gia khác tin rằng AI sẽ dần “thấu hiểu” hoặc ít nhất giả lập đủ sâu để truyền đạt xúc cảm.
Tác động lao động và việc làm
Khi AI tự động hóa tác vụ, tiết kiệm chi phí, đâu là cơ hội cho con người? Altman khẳng định lịch sử cho thấy con người luôn tạo ra công việc mới ở trình độ cao hơn khi công nghệ thay thế lao động chân tay. Ông tin rằng “AI sẽ giải phóng tiềm năng sáng tạo” hơn là chỉ cắt giảm nhân lực.

Những Thách Thức: Quy Định, Bảo Mật Và Bài Toán An Toàn

Không chỉ vẽ ra viễn cảnh tươi sáng, Sam Altman thừa nhận AI cũng đối diện nguy cơ bị lợi dụng. Khi AI “biết code” giỏi hơn, tấn công mạng cũng có thể tinh vi hơn. Vì vậy, Altman kêu gọi thiết lập các quy định hợp lý, tránh lạm dụng.

Tuy quan điểm “cần có luật lệ” thoạt đầu gây sốc với một CEO công nghệ, Altman lý giải rằng mọi phát kiến “dù là điện, xe hơi hay Internet” đều đi cùng khung pháp lý. Vấn đề là tìm cách “cân bằng,” không siết chặt đến mức triệt tiêu sáng tạo, nhưng cũng không thả lỏng đến mức để các thực thể xấu thao túng.

Softbank Và Mục Tiêu “1 Tỷ Agent”

Trong phần phỏng vấn với Chủ tịch SoftBank – Masayoshi Son, người nổi tiếng với những tầm nhìn táo bạo, cả hai liên tục trao đổi về việc mở rộng AI tại Nhật. Son chia sẻ ý tưởng tạo ra “1 tỷ agent” chỉ riêng cho nội bộ SoftBank. Ông muốn mỗi tài khoản, mỗi bộ phận, mỗi dịch vụ trong tập đoàn đều có một agent riêng để xử lý tự động các nhiệm vụ.

“Chúng tôi có 70 triệu người dùng PayPay, 40 triệu thuê bao di động, 100 triệu tài khoản LINE… Mỗi dịch vụ, mỗi tác vụ nhỏ sẽ được trao cho một agent làm việc độc lập. Đó là cách chúng tôi nâng cấp năng suất.”

Sam Altman bày tỏ sự hào hứng, đồng thời khẳng định công nghệ hiện tại đủ sức nhân rộng “hàng tỷ agent” nếu có hạ tầng phù hợp.

Thử Thách Và Hy Vọng Cho Tương Lai

Rốt cuộc, AI agent phải đối mặt nhiều trở ngại:

Hạn chế về chi phí, hạ tầng tính toán: Để mô hình chạy mượt, thời gian chờ ngắn, vẫn cần dữ liệu center đủ lớn, đặc biệt là địa phương hóa (on-premise) cho những yêu cầu bảo mật cao.
Lo ngại về “giáo dục” và “báo động AI hủy diệt”: Tuy dư luận lo ngại AI lấy hết việc làm, gây xung đột, song Altman cho rằng điểm mấu chốt là “chúng ta vẫn luôn tìm được việc mới mang tính giá trị cao hơn.”
Bài toán bảo mật: AI mạnh mẽ là con dao hai lưỡi. Vấn đề đặt ra không chỉ là an toàn dữ liệu, mà cả nguy cơ tấn công mạng, hack hệ thống cấp độ cao. OpenAI cam kết tiếp tục phát triển tính năng an toàn và huấn luyện AI để “không xuất” nội dung nguy hiểm.

Dù vậy, triển vọng vẫn vượt trội. “Deep Research” có thể đẩy nhanh tốc độ khoa học, “AI agent” hỗ trợ doanh nghiệp vận hành tự động, “Innovator” chinh phục sáng tạo mới… Tất cả góp phần đưa con người đến gần hơn với xã hội tối ưu về năng suất, đa dạng về ý tưởng, và nhanh chóng giải quyết các vấn đề nhân loại đang đối mặt.

Kết nối “sức mạnh” và “trí tuệ”

Chìa khóa cho cuộc cách mạng AI không chỉ nằm ở mô hình ngôn ngữ, mà còn là mạng lưới kết nối khắp nơi. Sam Altman dự đoán một kỷ nguyên “agent to agent,” nơi các hệ thống AI tương tác, thậm chí “hợp tác” để hoàn thành các chuỗi công việc phức tạp. Từ đó, AI dần đảm nhiệm những khâu khó nhằn nhất, để con người tập trung vào khâu quản trị, định hướng và sáng tạo.

Cuộc trò chuyện của Sam Altman tại Tokyo cho thấy OpenAI không còn muốn dừng ở những mẫu chatbot trả lời câu hỏi thông minh. Họ khát khao vươn tới bức tranh AI tổng quát hơn, cho phép máy móc suy luận sâu, hành động độc lập và thậm chí hướng tới sáng tạo tri thức mới. Deep Research được ra mắt như một minh chứng: AI đã bắt đầu thực hiện những công việc “kỳ công” của con người – sàng lọc tin tức, nối kết dữ liệu, trả về báo cáo chuyên sâu.

Bên cạnh các hứa hẹn về y tế, giáo dục, robot hay khoa học, Altman và những đối tác như SoftBank, ARM cũng không né tránh bài toán quy mô “siêu máy tính” và đặt ra vấn đề quy định pháp lý. Thế nhưng, giữa các thách thức, bức tranh tương lai về “1 tỷ agent” tại những tập đoàn khổng lồ, hay viễn cảnh AI tương tác liên lục địa vẫn đầy hào hứng và tiềm năng.

“AI agent sẽ như bệ phóng đưa nhân loại sang chương mới, nơi chúng ta ‘làm được nhiều việc hơn, trong ít thời gian hơn’. Và đó chính là động lực lớn lao nhất để chúng tôi tiếp tục.” – Sam Altman.