Phần 1: Giới thiệu về Giao thức Agent2Agent (A2A) của Google

1.1. A2A là gì? Mục tiêu và Tầm nhìn

Agent2Agent (A2A) là một giao thức mở mới do Google giới thiệu, được thiết kế với mục tiêu cốt lõi là cho phép các agent trí tuệ nhân tạo (AI) giao tiếp với nhau, trao đổi thông tin một cách an toàn và phối hợp hành động trên các nền tảng, ứng dụng doanh nghiệp, framework (như Agent Development Kit – ADK, LangGraph, Crew.ai) và nhà cung cấp khác nhau.¹ Giao thức này ra đời nhằm giải quyết một trong những thách thức lớn nhất trong việc áp dụng AI trong doanh nghiệp: sự phân mảnh và thiếu khả năng tương tác giữa các agent được xây dựng bằng các công cụ và công nghệ riêng biệt.¹

Mục tiêu của A2A là cung cấp một “ngôn ngữ chung” ¹, một tiêu chuẩn mở để các agent AI, bất kể chúng được xây dựng trên nền tảng nào, có thể cộng tác hiệu quả. Tầm nhìn xa hơn là tạo điều kiện cho việc thực hiện các tác vụ phức tạp, đa bước, đòi hỏi sự phối hợp giữa nhiều hệ thống và agent chuyên biệt khác nhau.² Thay vì các giải pháp tích hợp tùy chỉnh, phân mảnh và dễ đổ vỡ ¹, A2A hướng tới việc tạo ra một nền tảng vững chắc cho các hệ thống đa agent (multi-agent systems) hoạt động một cách đáng tin cậy.

Việc Google ra mắt A2A dưới dạng một giao thức mở, ngay cả khi họ có các công cụ phát triển agent riêng (như ADK), cho thấy một động thái chiến lược nhằm thiết lập một tiêu chuẩn có khả năng mang lại lợi ích cho toàn bộ hệ sinh thái AI, đồng thời thúc đẩy sự chấp nhận rộng rãi hơn. Tính mở khuyến khích sự tham gia từ các đối tác trong ngành (hơn 50 đối tác được đề cập ¹) và cộng đồng các nhà phát triển ², làm tăng đáng kể cơ hội để giao thức này trở thành một tiêu chuẩn phổ biến. Điều này tạo ra một sân chơi chung, nơi các agent từ nhiều nguồn gốc khác nhau có thể “hiểu” và “nói chuyện” với nhau, mở đường cho sự hợp tác và đổi mới ở quy mô lớn hơn.

1.2. Tại sao A2A quan trọng cho Hệ sinh thái AI Doanh nghiệp?

Trong bối cảnh doanh nghiệp hiện đại, việc tích hợp và tự động hóa các quy trình ngày càng trở nên phức tạp. Các tổ chức thường phải đối mặt với khó khăn khi cố gắng kết nối các agent AI được xây dựng trên các framework khác nhau hoặc do các nhà cung cấp khác nhau phát triển.¹ Sự thiếu tương thích này tạo ra các rào cản, làm chậm quá trình triển khai và hạn chế tiềm năng của AI. Các giải pháp hiện có thường mang tính chắp vá, thiếu tính ổn định và khó bảo trì.¹ Giai đoạn tiếp theo của sự phát triển AI được dự đoán sẽ tập trung vào các hệ thống đa agent, nơi nhiều agent cùng phối hợp để thực hiện các quy trình phức tạp.⁴

A2A cung cấp lớp tương tác cần thiết để giải quyết vấn đề này.¹ Nó hoạt động như một cầu nối, một ngôn ngữ tiêu chuẩn hóa cho phép các agent giao tiếp và cộng tác một cách liền mạch, bất kể công nghệ nền tảng của chúng. Nếu không có một tiêu chuẩn như A2A, việc xây dựng các hệ thống đa agent mạnh mẽ, tận dụng được các agent chuyên biệt tốt nhất từ các nguồn khác nhau, sẽ cực kỳ khó khăn và tốn kém, đòi hỏi các tích hợp tùy chỉnh phức tạp và dễ bị lỗi. A2A hứa hẹn giải quyết “bài toán Tháp Babel” này cho thế giới AI agent.

Do đó, A2A không chỉ đơn thuần là một giao thức giao tiếp; nó là một cơ sở hạ tầng nền tảng cho phép tự động hóa các quy trình công việc phức tạp, mô phỏng hoặc thậm chí vượt qua khả năng cộng tác của con người giữa các bộ phận hoặc hệ thống phần mềm khác nhau.¹ Các quy trình kinh doanh phức tạp, chẳng hạn như quy trình tuyển dụng ², định giá sản phẩm ¹ hay lập kế hoạch chuỗi cung ứng ⁷, thường bao gồm nhiều bước và liên quan đến nhiều hệ thống hoặc agent chuyên biệt. A2A cung cấp các “đường ray” giao tiếp được tiêu chuẩn hóa để các agent này tương tác một cách đáng tin cậy và phối hợp hành động. Điều này mở ra khả năng tự động hóa ở quy mô và mức độ phức tạp chưa từng có trước đây, vượt xa các tác vụ chỉ do một agent đơn lẻ thực hiện, hướng tới viễn cảnh về các “bầy đàn agent” (agentic swarms) cộng tác quy mô lớn.⁸

1.3. Tính chất Mở và Hợp tác Cộng đồng

Một trong những yếu tố then chốt của A2A là tính chất mở của nó.¹ Google đã chủ động ra mắt A2A như một giao thức mở, được xây dựng dựa trên các tiêu chuẩn web phổ biến và đã được chấp nhận rộng rãi như HTTP, Server-Sent Events (SSE), và JSON-RPC.² Cách tiếp cận này giúp giảm bớt rào cản kỹ thuật cho các doanh nghiệp muốn tích hợp A2A vào hạ tầng công nghệ thông tin hiện có của họ.²

Hơn nữa, Google không phát triển A2A một cách đơn độc. Họ đã hợp tác với hơn 50 nhà lãnh đạo công nghệ và nhà cung cấp dịch vụ hàng đầu trong ngành, bao gồm các tên tuổi lớn như Atlassian, Box, Salesforce, SAP, ServiceNow, Accenture, BCG, Capgemini và nhiều công ty khác.¹ Sự hợp tác rộng rãi này không chỉ đảm bảo rằng A2A được thiết kế để đáp ứng nhu cầu thực tế của doanh nghiệp mà còn tạo ra một động lực mạnh mẽ cho việc áp dụng giao thức này. Đặc tả kỹ thuật của A2A được phát hành dưới dạng mã nguồn mở, đi kèm với các lộ trình đóng góp rõ ràng, mời gọi sự tham gia và cải tiến từ cộng đồng.²

Việc nhấn mạnh vào tính mở và hợp tác cộng đồng là một chiến lược nhằm xây dựng một hệ sinh thái rộng lớn xung quanh A2A.¹ Bằng cách này, Google định vị mình là người dẫn dắt và định hình tương lai của các hệ thống đa agent, ngay cả khi bản thân giao thức là mở. Một tiêu chuẩn mở cần có một khối lượng người dùng và người triển khai đủ lớn để thành công. Việc hợp tác với các công ty lớn giúp tạo dựng uy tín và khuyến khích việc áp dụng A2A trong các hệ sinh thái tương ứng của họ.² Mặc dù A2A là mở, Google vẫn có thể tối ưu hóa các công cụ và nền tảng của riêng mình (như Vertex AI, ADK, Gemini) để hoạt động tốt nhất với giao thức này ¹, tạo ra lợi thế cạnh tranh trong khuôn khổ mở và thúc đẩy việc sử dụng các dịch vụ Google Cloud.

Phần 2: Bản chất Kỹ thuật của A2A

2.1. Cách A2A Hoạt động: Khám phá Năng lực và Giao tiếp

Về mặt kỹ thuật, A2A định nghĩa một phương thức nhất quán và có cấu trúc để các agent tự trị có thể khám phá và giao tiếp với nhau.¹⁰ Quá trình này bắt đầu bằng việc agent “quảng cáo” các khả năng của mình thông qua một “Thẻ Agent” (Agent Card) công khai.² Agent Card này được định dạng dưới dạng JSON và thường được truy cập qua giao thức HTTP. Nó chứa các thông tin quan trọng như địa chỉ truy cập (thông tin hosting/DNS), phiên bản của agent, và quan trọng nhất là danh sách các “kỹ năng” (skills) mà agent đó có thể thực hiện.⁷

Dựa trên thông tin từ Agent Card, một agent “khách” (client agent) – tức là agent cần thực hiện một tác vụ – có thể xác định và lựa chọn một agent “từ xa” (remote agent) phù hợp nhất để ủy thác công việc.² Sau khi xác định được đối tác tiềm năng, giao thức A2A sẽ điều phối quá trình giao tiếp tiếp theo. Quá trình này bao gồm việc đàm phán về phương thức tương tác – liệu sẽ sử dụng văn bản, biểu mẫu (forms), hay thậm chí là các luồng âm thanh/video hai chiều.¹ Quan trọng là, A2A được thiết kế để cho phép sự cộng tác này diễn ra ngay cả khi các agent không chia sẻ bộ nhớ (memory), công cụ (tools) hoặc ngữ cảnh (context) chung.² Sau khi đàm phán thành công, các agent có thể trao đổi thông tin một cách an toàn để hoàn thành tác vụ được giao.¹

Cơ chế Agent Card này tạo điều kiện cho một phương pháp tiếp cận phi tập trung trong việc khám phá và tương tác giữa các agent. Các agent không nhất thiết phải đăng ký với một registry trung tâm (mặc dù các nền tảng như Agentspace có thể cung cấp chức năng này ¹); chúng có khả năng tự khám phá lẫn nhau nếu biết nơi tìm kiếm Card của đối phương (ví dụ: thông qua DNS ¹⁰). Giao thức dựa trên việc các agent tự công khai thẻ của mình qua HTTP ², cho thấy khả năng khám phá ngang hàng (peer-to-peer) là hoàn toàn có thể. Mặc dù các nền tảng tập trung có thể đơn giản hóa quá trình này, bản thân giao thức A2A không bắt buộc phải có sự tập trung hóa để khám phá, cho phép các kiến trúc hệ thống linh hoạt hơn.

2.2. Các Thành phần Chính: Agent Client, Agent Remote, Agent Card

Kiến trúc tương tác của A2A xoay quanh ba thành phần chính:

Agent Client: Đây là agent khởi tạo yêu cầu. Nó chịu trách nhiệm xác định nhu cầu, xây dựng và truyền đạt các tác vụ cần thực hiện tới một agent khác.²
Agent Remote: Đây là agent nhận yêu cầu và thực hiện tác vụ. Nó tiếp nhận chỉ thị từ Agent Client và cố gắng cung cấp thông tin chính xác hoặc thực hiện hành động được yêu cầu.²
Agent Card: Đây là “danh thiếp” kỹ thuật số của một agent, được định dạng bằng JSON.² Nó chứa thông tin mô tả về agent (phiên bản, địa chỉ) và danh sách các khả năng (skills) mà agent đó sở hữu. Agent Card đóng vai trò then chốt trong việc cho phép Agent Client khám phá và lựa chọn Agent Remote phù hợp mà không cần tích hợp tùy chỉnh trước đó.²

Mô hình Client-Remote này cùng với Agent Card tạo thành nền tảng cho phép các agent được phát triển độc lập có thể tương tác và cộng tác một cách hiệu quả và có cấu trúc.

2.3. Hỗ trợ Đa phương thức (Text, Audio, Video)

Nhận thức rằng thế giới tương tác của agent không chỉ giới hạn ở văn bản, A2A được thiết kế với khả năng hỗ trợ đa phương thức (modality-agnostic).² Giao thức này hỗ trợ truyền phát (streaming) âm thanh và video hai chiều, bên cạnh giao tiếp văn bản truyền thống.² Điều này mở ra khả năng tương tác tự nhiên hơn, giống như con người, vượt ra ngoài giao diện dựa trên văn bản.³

Các agent sử dụng A2A có thể đàm phán về các khả năng giao diện người dùng (UI) mà chúng hỗ trợ, ví dụ như hiển thị iframe, video, biểu mẫu web, v.v..² Khả năng này rất quan trọng vì các tương tác giữa người và agent, cũng như giữa các agent với nhau, ngày càng trở nên phong phú hơn. Việc hỗ trợ streaming audio/video cho phép các trường hợp sử dụng liên quan đến xử lý giọng nói hoặc video theo thời gian thực, hoặc sự cộng tác đa phương thức giữa các agent.⁸

Việc tích hợp hỗ trợ đa phương thức ngay từ đầu giúp A2A trở nên linh hoạt và sẵn sàng cho tương lai (future-proofing).² Nó có khả năng xử lý các kịch bản tương tác phong phú và phức tạp hơn so với các giao thức chỉ dựa trên văn bản. Điều này hoàn toàn phù hợp với các khả năng đa phương thức ngày càng tăng của các mô hình ngôn ngữ lớn như Gemini.⁶ Khi các mô hình AI ngày càng có khả năng xử lý và tạo ra nội dung đa phương thức, việc các agent có thể trao đổi loại dữ liệu này thông qua A2A sẽ cho phép tự động hóa các tác vụ trước đây đòi hỏi sự can thiệp của con người (ví dụ: phân tích luồng video, tham gia cuộc gọi thoại), qua đó mở rộng đáng kể phạm vi ứng dụng tiềm năng của các agent kết nối qua A2A.

2.4. Bảo mật và Xác thực

Bảo mật là yếu tố tối quan trọng trong môi trường doanh nghiệp, và A2A đã được thiết kế với các cơ chế bảo mật tích hợp. Giao thức này cho phép trao đổi thông tin và cộng tác một cách an toàn giữa các agent.¹ Nó được thiết kế để “an toàn theo mặc định” (secure by default) và hỗ trợ các luồng xác thực và quản lý danh tính an toàn, tương đương với cấp độ xác thực của OpenAPI.⁷ Điều này đảm bảo rằng chỉ các agent được ủy quyền mới có thể giao tiếp và trao đổi dữ liệu nhạy cảm, đáp ứng các yêu cầu nghiêm ngặt về bảo mật và tuân thủ của doanh nghiệp. Việc đề cập đến tiêu chuẩn OpenAPI cung cấp một tham chiếu quen thuộc và đáng tin cậy cho các nhà phát triển khi đánh giá khả năng bảo mật của giao thức.

Phần 3: Hướng dẫn Sử dụng Cơ bản và Tích hợp

3.1. A2A trong Hệ sinh thái Google AI: Vertex AI, ADK, Agent Engine, Agentspace

Mặc dù A2A là một giao thức mở, được thiết kế để hoạt động trên nhiều nền tảng và framework khác nhau, Google Cloud cung cấp một bộ công cụ tích hợp chặt chẽ để hỗ trợ việc xây dựng, triển khai và quản lý các agent sử dụng A2A. Hệ sinh thái này bao gồm:

Vertex AI: Nền tảng AI/ML hợp nhất của Google Cloud, cung cấp cơ sở hạ tầng, các mô hình AI (bao gồm cả Gemini), và các công cụ để huấn luyện, triển khai và quản lý các ứng dụng AI, bao gồm cả các agent.¹
Agent Development Kit (ADK): Một framework mã nguồn mở được thiết kế để đơn giản hóa việc phát triển các agent và hệ thống đa agent phức tạp.¹ ADK cung cấp các thành phần và mẫu dựng sẵn để tăng tốc quá trình phát triển.¹
Agent Engine: Một môi trường runtime được quản lý hoàn toàn trên Vertex AI, được thiết kế để triển khai và vận hành các agent (bao gồm cả những agent được xây dựng bằng ADK hoặc các framework khác) một cách đáng tin cậy và có khả năng mở rộng.¹ Agent Engine hỗ trợ quản lý bộ nhớ ngắn hạn và dài hạn cho agent, cho phép duy trì ngữ cảnh qua các phiên tương tác.¹
Agentspace: Một nền tảng dành cho doanh nghiệp, cho phép nhân viên tương tác với các agent AI, tìm kiếm thông tin trong toàn tổ chức, và thực hiện các tác vụ công việc.¹ Các agent được triển khai trên Agent Engine có thể được đăng ký và truy cập thông qua Agentspace.¹ Agentspace cũng hỗ trợ giao thức A2A, cho phép các agent nội bộ tương tác với các agent bên ngoài hoặc các agent khác trong cùng không gian.⁴

Sự kết hợp của các công cụ này tạo thành một ngăn xếp (stack) toàn diện. A2A cung cấp khả năng tương tác giữa các agent, ADK cung cấp công cụ để xây dựng chúng, Agent Engine cung cấp môi trường để chạy chúng một cách đáng tin cậy (với khả năng quản lý bộ nhớ ¹), Vertex AI cung cấp các mô hình và khả năng nền tảng (như grounding dữ liệu ¹), và Agentspace cung cấp nền tảng để sử dụng chúng trong bối cảnh doanh nghiệp với các kiểm soát quản trị.¹ Chiến lược này của Google là cung cấp một giải pháp đầu cuối, tạo ra một hệ sinh thái mạnh mẽ, khuyến khích việc áp dụng A2A và các dịch vụ liên quan trên Google Cloud.

3.2. Xây dựng Agent có khả năng A2A với ADK

Agent Development Kit (ADK) được Google giới thiệu như một công cụ chủ lực để xây dựng các agent phức tạp và hệ thống đa agent.⁴ Đây là một framework mã nguồn mở, ban đầu có sẵn cho Python ⁴, được thiết kế để đơn giản hóa toàn bộ quy trình phát triển end-to-end.⁹ Mặc dù được tối ưu hóa để hoạt động hiệu quả nhất với các mô hình Gemini và nền tảng Vertex AI ¹, ADK vẫn duy trì tính linh hoạt, cho phép làm việc với các mô hình AI khác (thông qua Vertex AI Model Garden) và các công cụ ưa thích của nhà phát triển.¹

ADK hỗ trợ việc cấu trúc các hệ thống đa agent thông qua các khái niệm phân cấp như agent cha (parent_agent) và agent con (sub_agents).¹³ Nó cũng cung cấp các mẫu (patterns) và thành phần dựng sẵn trong “Agent Garden” để tăng tốc độ phát triển.¹ Google nhấn mạnh rằng với ADK, việc xây dựng và triển khai một agent có thể chỉ cần dưới 100 dòng code.⁴

Mặc dù tài liệu chi tiết về cách ADK trực tiếp triển khai hoặc hỗ trợ giao thức A2A chưa được nêu rõ trong các nguồn cung cấp, có thể suy luận rằng ADK sẽ cung cấp các lớp trừu tượng (abstractions) hoặc tiện ích (utilities) để giúp các nhà phát triển dễ dàng tích hợp khả năng giao tiếp A2A vào các agent mà họ xây dựng, đặc biệt là trong các hệ thống đa agent được định nghĩa bằng cấu trúc phân cấp của ADK.¹³ Các agent được xây dựng bằng ADK có thể được triển khai lên Agent Engine để có một môi trường runtime được quản lý.⁴

3.3. Ví dụ về Luồng Giao tiếp A2A

Để minh họa cách A2A hoạt động trong thực tế, hãy xem xét một số ví dụ:

Quy trình tuyển dụng ²: Một người quản lý tuyển dụng có thể yêu cầu agent chính của họ (ví dụ, trong giao diện Agentspace) tìm kiếm ứng viên phù hợp với mô tả công việc, địa điểm và bộ kỹ năng cụ thể. Agent chính này sau đó sẽ sử dụng A2A để giao tiếp và ủy thác các nhiệm vụ con cho các agent chuyên biệt khác:

Một agent tìm nguồn ứng viên (sourcing agent) sẽ truy vấn các cơ sở dữ liệu nội bộ và bên ngoài.
Một agent lên lịch phỏng vấn (scheduling agent) sẽ tương tác với lịch của người phỏng vấn và ứng viên.
Một agent kiểm tra lý lịch (background check agent) sẽ thực hiện các quy trình xác minh cần thiết. Thông qua A2A, các agent này phối hợp, trao đổi thông tin (ví dụ: danh sách ứng viên tiềm năng, thời gian phỏng vấn phù hợp, kết quả kiểm tra) và báo cáo lại cho agent chính, giúp đơn giản hóa và tự động hóa toàn bộ quy trình.
Sửa chữa ô tô ⁷: Người dùng báo cáo sự cố (“xe của tôi phát ra tiếng kêu lạch cạch”) cho một agent dịch vụ khách hàng. Agent này có thể sử dụng A2A để tương tác với người dùng hoặc các agent khác trong quá trình chẩn đoán (“gửi cho tôi ảnh bánh xe bên trái”, “tôi thấy có chất lỏng bị rò rỉ. Tình trạng này diễn ra bao lâu rồi?”). A2A cho phép giao tiếp qua lại liên tục và xây dựng một kế hoạch hành động để giải quyết vấn đề. Trong kịch bản này, một giao thức khác như MCP có thể được sử dụng song song để cung cấp cho agent các công cụ hoặc ngữ cảnh cần thiết (ví dụ: quyền truy cập vào lịch sử sửa chữa xe).

Những ví dụ này cho thấy A2A không chỉ là việc gửi tin nhắn giữa các agent. Nó là một giao thức cho phép ủy thác nhiệm vụ, cộng tác giải quyết vấn đề, và điều phối các quy trình phức tạp giữa các thực thể AI chuyên biệt.

3.4. Vai trò của Function Calling trong Tương tác Agent

Trong khi A2A điều phối sự tương tác giữa các agent, thì Function Calling (gọi hàm) là một cơ chế quan trọng cho phép một agent cá nhân tương tác với thế giới bên ngoài.¹⁵ Function Calling cho phép các mô hình ngôn ngữ lớn (LLM) như Gemini không chỉ tạo ra văn bản mà còn có thể gọi các hàm hoặc API bên ngoài một cách có cấu trúc.¹⁵ Khi một agent (được hỗ trợ bởi LLM) nhận được yêu cầu đòi hỏi thông tin hoặc hành động từ một hệ thống bên ngoài (ví dụ: cơ sở dữ liệu, API thời tiết, hệ thống CRM), nó có thể sử dụng Function Calling để:

Xác định hàm/API phù hợp cần gọi.
Trích xuất các tham số cần thiết từ yêu cầu của người dùng.
Tạo ra một yêu cầu gọi hàm có cấu trúc (thường là JSON).¹⁵

Ứng dụng chứa agent sau đó sẽ thực thi lệnh gọi hàm thực tế này, nhận kết quả trả về từ API/hàm bên ngoài, và gửi kết quả đó trở lại cho LLM.¹⁵ LLM sẽ sử dụng kết quả này để tạo ra phản hồi cuối cùng cho người dùng hoặc quyết định các bước tiếp theo. Các mô hình Gemini như Gemini 2.0 Flash hỗ trợ Function Calling và thậm chí cả việc tinh chỉnh (tuning) khả năng này.¹⁹

A2A và Function Calling hoạt động ở các cấp độ khác nhau nhưng bổ sung cho nhau một cách chặt chẽ trong các hệ thống đa agent.²⁰ Function Calling trao quyền cho các agent cá nhân để hành động – truy cập dữ liệu, thực hiện tính toán, tương tác với các hệ thống khác. A2A trao quyền cho nhiều agent để cộng tác – phối hợp các hành động riêng lẻ đó để đạt được một mục tiêu chung lớn hơn. Trong một quy trình công việc phức tạp được điều phối qua A2A, rất có thể mỗi agent tham gia sẽ sử dụng Function Calling để thực hiện các nhiệm vụ con được giao (ví dụ: agent lên lịch gọi API lịch, agent kiểm tra lý lịch gọi API xác minh).²

Phần 4: Khả năng Tương thích Mô hình Gemini

4.1. Vai trò của Gemini trong Hệ thống Đa Agent

Sự thành công của các hệ thống đa agent và giao thức A2A phụ thuộc rất nhiều vào khả năng của các mô hình ngôn ngữ lớn (LLM) nền tảng. Google định vị dòng mô hình Gemini, đặc biệt là các phiên bản mới như Gemini 2.0 và 2.5, là những “bộ não” mạnh mẽ, rất phù hợp để cung cấp năng lượng cho các agent và hệ thống đa agent phức tạp.¹

Các hệ thống này đòi hỏi các mô hình có khả năng suy luận (reasoning) nâng cao để hiểu các mục tiêu phức tạp, lập kế hoạch, phân chia nhiệm vụ, ủy thác cho các agent khác, và diễn giải kết quả từ nhiều nguồn.¹ Gemini 2.5 được nhấn mạnh là có khả năng suy luận tăng cường, có thể “suy nghĩ” qua các bước trước khi phản hồi, giúp cải thiện hiệu suất và độ chính xác.¹² Khả năng sử dụng công cụ (tool use) thông qua Function Calling cũng là một yếu tố quan trọng, cho phép các agent tương tác hiệu quả với môi trường bên ngoài.¹ Gemini đang được sử dụng để cung cấp sức mạnh cho các agent trong các sản phẩm của Google như Agentspace và Google Customer Engagement Suite.¹

Do đó, hiệu quả của A2A và các hệ thống đa agent được xây dựng dựa trên nó gắn liền với sức mạnh suy luận của các mô hình LLM cơ bản. Một giao thức mạnh mẽ như A2A cần các mô hình có năng lực như Gemini 2.5 để phát huy hết tiềm năng của nó trong việc tự động hóa các tác vụ phức tạp.¹ Việc phối hợp nhiều agent đòi hỏi sự hiểu biết về mục tiêu tổng thể, khả năng phân rã vấn đề, phân công nhiệm vụ và tổng hợp kết quả – tất cả đều là những năng lực suy luận cốt lõi mà các mô hình tiên tiến như Gemini được thiết kế để cung cấp.¹ Những tiến bộ trong các mô hình như Gemini trực tiếp cho phép các ứng dụng mạnh mẽ hơn của A2A.

4.2. Các Mô hình Gemini Hỗ trợ (Ví dụ: Gemini 2.5 Pro, Gemini 2.0 Flash)

Google đã tích hợp các mô hình Gemini vào hệ sinh thái phát triển agent của mình. Cụ thể:

Gemini 2.5 Pro / Gemini 2.5 Pro Experimental: Được tối ưu hóa cho độ chính xác và các tác vụ phức tạp như viết và gỡ lỗi mã nguồn hoặc trích xuất thông tin quan trọng.³ ADK được tối ưu hóa đặc biệt cho Gemini 2.5 Pro Experimental, tận dụng khả năng suy luận và sử dụng công cụ nâng cao của nó.¹ Mô hình này có sẵn trên Vertex AI dưới dạng public preview.³
Gemini 2.5 Flash: Một biến thể mới hơn, được tối ưu hóa cho các trường hợp sử dụng đòi hỏi độ trễ thấp và hiệu quả chi phí, chẳng hạn như tương tác khách hàng với khối lượng lớn.³ Nó có khả năng điều chỉnh độ sâu suy luận dựa trên độ phức tạp của yêu cầu.³
Gemini 2.0 Flash / Gemini 2.0 Flash Experimental: Một mô hình khác trong dòng Gemini, được đề cập trong các ví dụ mã nguồn của ADK ⁹ và hỗ trợ tinh chỉnh Function Calling.¹⁹ Nó cũng được sử dụng trong các ví dụ về ReAct agent và Function Calling.²⁰
Gemini 1.5 Models: Cũng được hỗ trợ và có sẵn thông qua generative AI hub của SAP.⁶

Các mô hình này, đặc biệt là thế hệ 2.x (Flash, Pro), được xem là phù hợp và thường được tối ưu hóa cho các trường hợp sử dụng liên quan đến agent và các giao thức như A2A, nhất là khi được sử dụng trong nền tảng Vertex AI.¹ Các biến thể Flash thường được định vị cho các ứng dụng cần tốc độ phản hồi nhanh và chi phí thấp hơn.³

4.3. Tối ưu hóa cho Gemini và Vertex AI

Mặc dù A2A và ADK được thiết kế với mục tiêu mở và linh hoạt, Google không che giấu việc các công cụ này được tối ưu hóa để hoạt động tốt nhất trong hệ sinh thái Google Cloud, đặc biệt là với các mô hình Gemini chạy trên Vertex AI.¹ Sự tối ưu hóa này cho phép các nhà phát triển khai thác tối đa các khả năng nâng cao của Gemini, chẳng hạn như khả năng suy luận phức tạp và sử dụng công cụ hiệu quả có trong Gemini 2.5 Pro Experimental.¹

Việc triển khai các agent được xây dựng bằng ADK lên môi trường runtime được quản lý của Vertex AI (Agent Engine) được mô tả là một lộ trình liền mạch và tự nhiên.⁹ Điều này mang lại lợi ích về khả năng mở rộng, độ tin cậy và các tính năng cấp doanh nghiệp mà Agent Engine cung cấp.¹ Do đó, trong khi các nhà phát triển có quyền tự do lựa chọn công cụ và mô hình, việc sử dụng ngăn xếp tích hợp của Google (A2A/ADK trên Gemini/Vertex AI) hứa hẹn mang lại hiệu suất tốt nhất và trải nghiệm phát triển mượt mà nhất, tạo động lực để các nhà phát triển lựa chọn Google Cloud.

Phần 5: So sánh A2A với các Phương pháp Khác

5.1. A2A và Model Context Protocol (MCP): Bổ sung hay Cạnh tranh?

Khi Google công bố A2A, một câu hỏi tự nhiên nảy sinh là mối quan hệ của nó với Model Context Protocol (MCP), một tiêu chuẩn khác do Anthropic đề xuất và được các công ty lớn như OpenAI áp dụng.¹⁰ Google đã rất cẩn thận trong việc định vị A2A là bổ sung chứ không phải cạnh tranh trực tiếp với MCP.¹

Theo Google, hai giao thức này giải quyết các vấn đề khác nhau trong hệ sinh thái đa agent ⁷:

A2A: Tập trung vào việc cho phép các agent giao tiếp, khám phá khả năng của nhau, đàm phán và phối hợp hành động. Nó giải quyết vấn đề tương tác giữa các agent.²
MCP: Tập trung vào việc cung cấp một cách tiêu chuẩn hóa để cung cấp công cụ và ngữ cảnh (dữ liệu) cho các agent hoặc LLM. Nó giải quyết vấn đề làm thế nào để agent truy cập tài nguyên cần thiết cho nhiệm vụ của mình.¹

Google minh họa sự bổ sung này qua ví dụ về cửa hàng sửa chữa ô tô: A2A được sử dụng cho cuộc trò chuyện qua lại giữa người dùng và agent (“xe tôi bị kêu”), trong khi MCP có thể được dùng để cung cấp cho agent quyền truy cập vào công cụ chẩn đoán hoặc lịch sử sửa chữa.⁷ Google cũng nhấn mạnh rằng ADK hỗ trợ MCP ³ và Google DeepMind có kế hoạch hỗ trợ MCP trong các mô hình và SDK Gemini.¹⁰

Tuy nhiên, bất chấp tuyên bố chính thức về tính bổ sung, sự xuất hiện của hai giao thức riêng biệt từ các ông lớn trong ngành AI (Google hậu thuẫn A2A, OpenAI áp dụng MCP ¹⁰) cho thấy khả năng xảy ra cạnh tranh trong tương lai hoặc một “cuộc chiến giành giật” sự chú ý của nhà phát triển và sự thống trị hệ sinh thái.¹⁰ Thời điểm ra mắt A2A, ngay sau khi OpenAI công khai áp dụng MCP, cũng rất đáng chú ý.¹⁰ Việc Google vừa hỗ trợ MCP ³ vừa đẩy mạnh A2A ¹ có vẻ như là một chiến lược phòng ngừa rủi ro (hedging bets), nhằm thu hút các nhà phát triển bất kể giao thức nào trở nên phổ biến hơn, trong khi vẫn ưu tiên sáng tạo của riêng mình trong hệ sinh thái của họ. Một số ý kiến trong ngành đặt câu hỏi liệu cả hai giao thức có thực sự cần thiết hay chúng có thể xung đột trong thực tế.¹⁰ Điểm khác biệt cốt lõi nằm ở trọng tâm: A2A tập trung vào tương tác agent, còn MCP tập trung vào truy cập tài nguyên của agent.

5.2. Bảng So sánh A2A và MCP

Bảng dưới đây tóm tắt những điểm khác biệt chính giữa A2A và MCP dựa trên các thông tin được công bố:

Đặc điểm	Agent2Agent (A2A)	Model Context Protocol (MCP)
Trọng tâm chính	Giao tiếp & tương tác giữa các agent ²	Cung cấp công cụ & ngữ cảnh cho agent/LLM ¹
Cơ chế	HTTP, JSON-RPC, SSE; Agent Cards để khám phá ²	Định dạng chuẩn hóa cho thông tin ngữ cảnh/công cụ ¹
Chức năng chính	Cho phép agent khám phá, đàm phán, cộng tác ²	Cho phép agent/LLM truy cập nguồn/công cụ bên ngoài ¹⁰
Mối quan hệ	Bổ sung cho MCP (theo Google) ²	Được bổ sung bởi A2A (theo Google) ²
Ví dụ sử dụng	Các agent phối hợp quy trình tuyển dụng ²	Agent sử dụng công cụ cụ thể (máy tính, API) ¹⁰
Đa phương thức	Hỗ trợ đa phương thức (text, audio, video) ²	Chủ yếu tập trung vào dữ liệu ngữ cảnh/công cụ (văn bản)

Bảng so sánh này giúp làm rõ phạm vi và mục đích dự kiến của từng giao thức, giải quyết sự nhầm lẫn tiềm ẩn và cung cấp một tài liệu tham khảo nhanh cho các nhà phát triển.

5.3. Điểm Độc đáo của A2A

So với các phương pháp giao tiếp hoặc tích hợp agent khác, A2A có một số điểm độc đáo được Google nhấn mạnh:

Tập trung vào Tương tác Độc lập: A2A được thiết kế để cho phép sự cộng tác ngay cả khi các agent không chia sẻ bộ nhớ, công cụ hoặc ngữ cảnh chung.² Điều này có nghĩa là các agent được xây dựng hoàn toàn độc lập vẫn có thể làm việc cùng nhau, miễn là chúng tuân thủ giao thức A2A.
Thiết kế cho Nhu cầu Doanh nghiệp: Giao thức được xây dựng để xử lý các yêu cầu thực tế của doanh nghiệp, bao gồm các tác vụ chạy dài (long-running tasks) như lập kế hoạch chuỗi cung ứng và hỗ trợ tương tác đa phương thức (âm thanh, video).⁷
Kết hợp Tính Mở và Nền tảng Toàn diện: Sự kết hợp giữa một giao thức mở (A2A) với một bộ công cụ và nền tảng toàn diện (ADK, Agent Engine, Vertex AI) được xem là một điểm mạnh độc đáo, cung cấp cả sự linh hoạt và khả năng thực thi đáng tin cậy mà các giải pháp phân mảnh khác khó có thể đạt được.¹
Hỗ trợ Đa phương thức Nguyên bản: Khả năng hỗ trợ streaming audio và video hai chiều là một điểm khác biệt quan trọng, cho phép các tương tác phong phú và tự nhiên hơn.²

Những đặc điểm này định vị A2A như một giải pháp mạnh mẽ và linh hoạt, đặc biệt phù hợp cho việc xây dựng các hệ thống đa agent phức tạp trong môi trường doanh nghiệp.

Phần 6: Trường hợp Sử dụng và Lợi ích

6.1. Ví dụ Thực tế trong Doanh nghiệp

Tiềm năng của các hệ thống đa agent được kết nối qua A2A được minh họa rõ nét qua các trường hợp sử dụng thực tế và tiềm năng trong nhiều lĩnh vực:

Tự động hóa Quy trình Định giá: Công ty Revionics đã sử dụng ADK (có thể tích hợp với A2A) để tự động hóa toàn bộ quy trình định giá, kết hợp AI định giá của họ với AI agent để xử lý việc truy xuất dữ liệu và áp dụng các ràng buộc.¹
Phân tích Video: Một agent được xây dựng bằng ADK và Agent Engine, sử dụng Gemini, đã được triển khai để phân tích video, giúp tiết kiệm thời gian phát triển đáng kể.¹
Y tế: Tổ chức Highmark Health đang sử dụng các công cụ dựa trên Gemini và Vertex AI để tối ưu hóa việc tóm tắt hồ sơ y tế và phân tích dữ liệu.⁵ A2A có thể mở rộng khả năng này bằng cách cho phép các agent chuyên biệt (ví dụ: agent phân tích hình ảnh y tế, agent truy xuất thông tin di truyền) cộng tác.
Tuyển dụng: Như đã đề cập, A2A có thể điều phối các agent chuyên biệt để tự động hóa các bước như tìm nguồn ứng viên, lên lịch phỏng vấn và kiểm tra lý lịch.²
Chuỗi Cung ứng: A2A có thể xử lý các tác vụ chạy dài, phức tạp trong việc lập kế hoạch và tối ưu hóa chuỗi cung ứng.⁷
Hợp tác Đa nền tảng: SAP và Google Cloud đang hợp tác để cho phép các agent AI tương tác và cộng tác trên các nền tảng của cả hai công ty, sử dụng A2A làm nền tảng.⁶
Hỗ trợ Nhân viên (thông qua Agentspace):

Nghiên cứu Chuyên sâu (Deep Research): Một agent khám phá các chủ đề phức tạp, tổng hợp thông tin từ nguồn nội bộ và bên ngoài thành báo cáo dễ đọc.⁴
Tạo Ý tưởng (Idea Generation): Một agent giúp động não, phát triển và đánh giá các ý tưởng mới.⁴
Tự động hóa Chức năng Kinh doanh: Hỗ trợ các bộ phận như marketing, tài chính, pháp lý trong việc nghiên cứu, soạn thảo nội dung và tự động hóa các tác vụ lặp đi lặp lại.¹¹

Những ví dụ này cho thấy phạm vi ứng dụng rộng rãi của các hệ thống đa agent và cách A2A có thể đóng vai trò là chất xúc tác, cho phép tự động hóa và nâng cao hiệu quả hoạt động trên nhiều chức năng và ngành nghề khác nhau.

6.2. Lợi ích Chính: Khả năng Tương tác, Tự động hóa Phức tạp, Linh hoạt

Việc áp dụng A2A và xây dựng các hệ thống đa agent mang lại nhiều lợi ích quan trọng cho doanh nghiệp:

Khả năng Tương tác (Interoperability): Đây là lợi ích cốt lõi. A2A phá vỡ các rào cản giữa các agent được xây dựng trên các framework và bởi các nhà cung cấp khác nhau, cho phép chúng giao tiếp và cộng tác một cách liền mạch.¹ Điều này tạo ra một hệ sinh thái AI thống nhất hơn.
Tự động hóa Phức tạp: Bằng cách cho phép các agent chuyên biệt phối hợp, A2A mở đường cho việc tự động hóa các quy trình công việc phức tạp, đa bước mà trước đây rất khó hoặc không thể tự động hóa hoàn toàn.¹ Các tác vụ đòi hỏi sự tham gia của nhiều hệ thống hoặc bộ phận có thể được điều phối hiệu quả hơn.
Linh hoạt và Tái sử dụng: Doanh nghiệp có thể linh hoạt lựa chọn và kết hợp các agent tốt nhất cho từng nhiệm vụ cụ thể, bất kể nguồn gốc của chúng.² Các agent chuyên biệt có thể được tái sử dụng trong nhiều quy trình khác nhau, tối ưu hóa đầu tư vào AI.
Tăng tốc Phát triển: Việc sử dụng các giao thức chuẩn hóa như A2A và các framework như ADK (với các mẫu dựng sẵn) có thể giúp giảm đáng kể thời gian và công sức phát triển các ứng dụng AI phức tạp.¹
Tận dụng Chuyên môn Hóa: Cho phép các agent chuyên biệt (ví dụ: agent phân tích dữ liệu, agent xử lý ngôn ngữ tự nhiên, agent tương tác khách hàng) đóng góp vào một mục tiêu chung, tận dụng tối đa khả năng của từng agent.¹

Nhìn chung, A2A hứa hẹn mang lại một bước tiến đáng kể trong việc xây dựng các hệ thống AI mạnh mẽ, linh hoạt và hiệu quả hơn cho doanh nghiệp.

Phần 7: Kết luận và Tương lai của A2A

7.1. Tóm tắt các Điểm chính

Giao thức Agent2Agent (A2A) của Google đại diện cho một nỗ lực quan trọng nhằm giải quyết thách thức về khả năng tương tác trong hệ sinh thái AI ngày càng phát triển. Các điểm chính cần nhớ bao gồm:

Bản chất: A2A là một giao thức mở, được xây dựng trên các tiêu chuẩn web hiện có, nhằm cho phép các agent AI từ các nguồn gốc khác nhau giao tiếp và cộng tác một cách an toàn.
Mục tiêu: Giải quyết sự phân mảnh, tạo điều kiện cho việc xây dựng các hệ thống đa agent mạnh mẽ để tự động hóa các quy trình phức tạp.
Cơ chế: Sử dụng Agent Cards (JSON qua HTTP) để khám phá khả năng và hỗ trợ giao tiếp đa phương thức (văn bản, âm thanh, video).
Hệ sinh thái Google: Tích hợp chặt chẽ với Vertex AI, Gemini, ADK, Agent Engine và Agentspace, cung cấp một ngăn xếp toàn diện nhưng vẫn duy trì tính mở.
So sánh với MCP: Được định vị là bổ sung cho MCP, tập trung vào giao tiếp giữa các agent trong khi MCP tập trung vào cung cấp công cụ/ngữ cảnh cho agent.
Lợi ích: Mang lại khả năng tương tác, cho phép tự động hóa phức tạp, tăng tính linh hoạt và tận dụng hiệu quả các agent chuyên biệt.

7.2. Tiềm năng và Định hướng Phát triển Tương lai

A2A có tiềm năng to lớn để định hình lại cách chúng ta xây dựng và tương tác với các hệ thống AI. Nó không chỉ là một giải pháp kỹ thuật cho vấn đề tương tác mà còn là nền tảng cho một kỷ nguyên mới của AI agentic – nơi các agent không chỉ phản hồi mà còn chủ động cộng tác để giải quyết các vấn đề phức tạp.²

Tương lai của A2A có thể bao gồm:

Sự chấp nhận rộng rãi hơn: Với sự hỗ trợ từ hơn 50 đối tác ban đầu và tính chất mở, A2A có cơ hội trở thành một tiêu chuẩn công nghiệp de facto cho giao tiếp agent.²
Hệ sinh thái Agent phát triển mạnh: Một tiêu chuẩn chung như A2A có thể thúc đẩy sự phát triển của một thị trường agent, nơi các nhà phát triển có thể tạo ra và bán các agent chuyên biệt có thể dễ dàng “cắm” vào mạng lưới A2A – một mô hình “Agent-as-a-Service”.²³
Các ứng dụng phức tạp hơn: Khi giao thức trưởng thành và các mô hình AI (như Gemini) trở nên mạnh mẽ hơn, chúng ta có thể thấy các hệ thống đa agent đảm nhận các nhiệm vụ ngày càng phức tạp, thậm chí điều phối các “bầy đàn agent” ảo và vật lý.⁸
Tích hợp sâu hơn: A2A có thể được tích hợp sâu hơn vào các nền tảng doanh nghiệp và các công cụ phát triển, làm cho việc xây dựng và triển khai các hệ thống đa agent trở nên dễ dàng hơn nữa.

Google đã thể hiện cam kết xây dựng A2A một cách cởi mở, hợp tác với cộng đồng và các đối tác.² Sự phát triển liên tục của giao thức này, cùng với những tiến bộ trong mô hình AI và các công cụ phát triển, hứa hẹn sẽ mở ra những khả năng mới thú vị cho tự động hóa và trí tuệ nhân tạo. Việc kết hợp “bộ não” mạnh mẽ của Gemini với “hệ thần kinh” giao tiếp do A2A cung cấp ²³ tạo tiền đề cho một tương lai nơi các mạng lưới agent AI phân tán có thể xử lý các tác vụ phức tạp trên quy mô toàn doanh nghiệp hoặc thậm chí công cộng.

7.3. Tài nguyên Tham khảo Thêm

Để tìm hiểu sâu hơn về Agent2Agent và các công nghệ liên quan, bạn có thể tham khảo các tài nguyên sau:

Thông số kỹ thuật và Trang web A2A: Tìm kiếm “Agent2Agent protocol specification” hoặc truy cập trang web A2A được đề cập trong các bài đăng trên blog của Google (ví dụ: ²). Lưu ý: URL cụ thể https://google.github.io/A2A/#/ được đề cập trong.⁷
Blog Google Cloud AI & Developers: Theo dõi các bài viết về A2A, ADK, Agent Engine, Agentspace và Gemini trên các blog chính thức của Google (ví dụ: ¹).
Kho lưu trữ GitHub ADK: Khám phá mã nguồn và tài liệu của Agent Development Kit tại github.com/google/adk-python (được đề cập trong ²⁶) và tài liệu tại google.github.io/adk-docs/.¹³
Tài liệu Vertex AI: Tham khảo tài liệu về các mô hình Gemini, Function Calling và các tính năng AI khác trên trang tài liệu của Google Cloud Vertex AI (ví dụ: ¹⁹).
Tài liệu Google AI for Developers: Tìm hiểu về Gemini API và Function Calling tại ai.google.dev (ví dụ: ¹⁵).
Codelabs: Thực hành với các hướng dẫn từng bước về Function Calling trên Google Codelabs (ví dụ: ¹⁷).

Works cited

Build and manage multi-system agents with Vertex AI | Google Cloud Blog, accessed April 14, 2025, https://cloud.google.com/blog/products/ai-machine-learning/build-and-manage-multi-system-agents-with-vertex-ai
Announcing the Agent2Agent Protocol (A2A) – Google for Developers Blog, accessed April 14, 2025, https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/
Google Pushes Agent Interoperability With New Dev Kit and Agent2Agent Standard – Ken Yeung, accessed April 14, 2025, https://thelettertwo.com/2025/04/09/google-pushes-agent-interoperability-dev-kit-agent2agent-standard/
Google rolls out updates for building multi-agent AI ecosystems – SiliconANGLE, accessed April 14, 2025, https://siliconangle.com/2025/04/09/google-rolls-updates-building-multi-agent-ai-ecosystems/
Google Cloud sees multi-agent AI systems as ‘next frontier’ – Fierce Healthcare, accessed April 14, 2025, https://www.fiercehealthcare.com/ai-and-machine-learning/google-cloud-builds-out-ai-agent-capabilities-healthcare-highmark-health
How SAP and Google Cloud Are Advancing Enterprise AI Through Open Agent Collaboration, Model Choice, and Multimodal Intelligence, accessed April 14, 2025, https://news.sap.com/2025/04/sap-google-cloud-enterprise-ai-open-agent-collaboration-model-choice-multimodal-intelligence/
NEW: Google announces Agent2Agent : r/GeminiAI – Reddit, accessed April 14, 2025, https://www.reddit.com/r/GeminiAI/comments/1jvbx37/new_google_announces_agent2agent/
Google Deepmind just announced the Agent2Agent protocol like MCP but for full AI agents interoperability(This marks one of the most foundational milestones in creating massively coordinating virtual and physical agentic swarms ) – Reddit, accessed April 14, 2025, https://www.reddit.com/r/accelerate/comments/1jv4qio/google_deepmind_just_announced_the_agent2agent/
Agent Development Kit: Making it easy to build multi-agent applications, accessed April 14, 2025, https://developers.googleblog.com/en/agent-development-kit-easy-to-build-multi-agent-applications/
A2A and MCP: Start of the AI Agent Protocol Wars? – Koyeb, accessed April 14, 2025, https://www.koyeb.com/blog/a2a-and-mcp-start-of-the-ai-agent-protocol-wars
Bringing AI Agents to Enterprises with Google Agentspace | Google Cloud Blog, accessed April 14, 2025, https://cloud.google.com/blog/products/ai-machine-learning/bringing-ai-agents-to-enterprises-with-google-agentspace
Introducing Gemini 2.0: our new AI model for the agentic era – Google Blog, accessed April 14, 2025, https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/
Multi-Agent Systems in ADK – Google, accessed April 14, 2025, https://google.github.io/adk-docs/agents/multi-agents/
Google Cloud Next 2025: Gemini & agentic AI updates, new TPUs | Capacity Media, accessed April 14, 2025, https://www.capacitymedia.com/article/google-cloud-next-2025-gemini-agentic-ai-updates-new-tpus
Function Calling with the Gemini API | Google AI for Developers, accessed April 14, 2025, https://ai.google.dev/gemini-api/docs/function-calling
Gemini Function Calling: How to Unlock Autonomous AI Agents | Devoteam, accessed April 14, 2025, https://www.devoteam.com/expert-view/from-prompts-to-partners-how-gemini-pros-function-calling-ushers-in-the-era-of-autonomous-ai-agents/
How to Interact with APIs Using Function Calling in Gemini | Google Codelabs, accessed April 14, 2025, https://codelabs.developers.google.com/codelabs/gemini-function-calling
Function Calling Guide: Google DeepMind Gemini 2.0 Flash – Philschmid, accessed April 14, 2025, https://www.philschmid.de/gemini-function-calling
Tune function calling | Generative AI on Vertex AI – Google Cloud, accessed April 14, 2025, https://cloud.google.com/vertex-ai/generative-ai/docs/models/tune-function-calling
generative-ai/gemini/function-calling/intro_diy_react_agent.ipynb at main – GitHub, accessed April 14, 2025, https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/function-calling/intro_diy_react_agent.ipynb
generative-ai/gemini/agents/research-multi-agents/intro_research_multi_agents_gemini_2_0.ipynb at main – GitHub, accessed April 14, 2025, https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/agents/research-multi-agents/intro_research_multi_agents_gemini_2_0.ipynb
Welcome to Google Cloud Next ’25, accessed April 14, 2025, https://cloud.google.com/blog/topics/google-cloud-next/welcome-to-google-cloud-next25
Google’s A2A protocol + Gemini 2.5… feels like they’re building something big. : r/GeminiAI, accessed April 14, 2025, https://www.reddit.com/r/GeminiAI/comments/1jvt9io/googles_a2a_protocol_gemini_25_feels_like_theyre/
Introduction to function calling | Generative AI on Vertex AI – Google Cloud, accessed April 14, 2025, https://cloud.google.com/vertex-ai/generative-ai/docs/multimodal/function-calling
Google goes all in on agent development, Gemini at Google Cloud Next 25 – SD Times, accessed April 14, 2025, https://sdtimes.com/ai/google-goes-all-in-on-agent-development-gemini-advancements-at-google-cloud-next-25/
Google Launches an Agent SDK – Agent Development Kit – YouTube, accessed April 14, 2025, https://www.youtube.com/watch?v=G9wnpfW6lZY

Hướng dẫn Chuyên sâu về Giao thức Agent2Agent (A2A) của Google: Xây dựng Hệ sinh thái AI Tương tác

Phần 1: Giới thiệu về Giao thức Agent2Agent (A2A) của Google

1.1. A2A là gì? Mục tiêu và Tầm nhìn

1.2. Tại sao A2A quan trọng cho Hệ sinh thái AI Doanh nghiệp?

1.3. Tính chất Mở và Hợp tác Cộng đồng

Phần 2: Bản chất Kỹ thuật của A2A

2.1. Cách A2A Hoạt động: Khám phá Năng lực và Giao tiếp

2.2. Các Thành phần Chính: Agent Client, Agent Remote, Agent Card

2.3. Hỗ trợ Đa phương thức (Text, Audio, Video)

2.4. Bảo mật và Xác thực

Phần 3: Hướng dẫn Sử dụng Cơ bản và Tích hợp

3.1. A2A trong Hệ sinh thái Google AI: Vertex AI, ADK, Agent Engine, Agentspace

3.2. Xây dựng Agent có khả năng A2A với ADK

3.3. Ví dụ về Luồng Giao tiếp A2A

3.4. Vai trò của Function Calling trong Tương tác Agent

Phần 4: Khả năng Tương thích Mô hình Gemini

4.1. Vai trò của Gemini trong Hệ thống Đa Agent

4.2. Các Mô hình Gemini Hỗ trợ (Ví dụ: Gemini 2.5 Pro, Gemini 2.0 Flash)

4.3. Tối ưu hóa cho Gemini và Vertex AI

Phần 5: So sánh A2A với các Phương pháp Khác

5.1. A2A và Model Context Protocol (MCP): Bổ sung hay Cạnh tranh?

5.2. Bảng So sánh A2A và MCP

5.3. Điểm Độc đáo của A2A

Phần 6: Trường hợp Sử dụng và Lợi ích

6.1. Ví dụ Thực tế trong Doanh nghiệp

6.2. Lợi ích Chính: Khả năng Tương tác, Tự động hóa Phức tạp, Linh hoạt

Phần 7: Kết luận và Tương lai của A2A

7.1. Tóm tắt các Điểm chính

7.2. Tiềm năng và Định hướng Phát triển Tương lai

7.3. Tài nguyên Tham khảo Thêm

Works cited

Thẻ

Bình luận

Xem Nhiều Nhất

EPLAN – Cuộc “cách mạng” trong thiết kế và thi công hệ thống điện

Giới thiệu giải pháp công nghệ mới cho ngành dầu khí, năng lượng

Quản lý bảo trì, bảo dưỡng và sửa chữa cho các thiết bị cơ điện phục vụ sản xuất

Phần 1: Giới thiệu về Giao thức Agent2Agent (A2A) của Google

1.1. A2A là gì? Mục tiêu và Tầm nhìn

1.2. Tại sao A2A quan trọng cho Hệ sinh thái AI Doanh nghiệp?

1.3. Tính chất Mở và Hợp tác Cộng đồng

Phần 2: Bản chất Kỹ thuật của A2A

2.1. Cách A2A Hoạt động: Khám phá Năng lực và Giao tiếp

2.2. Các Thành phần Chính: Agent Client, Agent Remote, Agent Card

2.3. Hỗ trợ Đa phương thức (Text, Audio, Video)

2.4. Bảo mật và Xác thực

Phần 3: Hướng dẫn Sử dụng Cơ bản và Tích hợp

3.1. A2A trong Hệ sinh thái Google AI: Vertex AI, ADK, Agent Engine, Agentspace

3.2. Xây dựng Agent có khả năng A2A với ADK

3.3. Ví dụ về Luồng Giao tiếp A2A

3.4. Vai trò của Function Calling trong Tương tác Agent

Phần 4: Khả năng Tương thích Mô hình Gemini

4.1. Vai trò của Gemini trong Hệ thống Đa Agent

4.2. Các Mô hình Gemini Hỗ trợ (Ví dụ: Gemini 2.5 Pro, Gemini 2.0 Flash)

4.3. Tối ưu hóa cho Gemini và Vertex AI

Phần 5: So sánh A2A với các Phương pháp Khác

5.1. A2A và Model Context Protocol (MCP): Bổ sung hay Cạnh tranh?

5.2. Bảng So sánh A2A và MCP

5.3. Điểm Độc đáo của A2A

Phần 6: Trường hợp Sử dụng và Lợi ích

6.1. Ví dụ Thực tế trong Doanh nghiệp

6.2. Lợi ích Chính: Khả năng Tương tác, Tự động hóa Phức tạp, Linh hoạt

Phần 7: Kết luận và Tương lai của A2A

7.1. Tóm tắt các Điểm chính

7.2. Tiềm năng và Định hướng Phát triển Tương lai

7.3. Tài nguyên Tham khảo Thêm

Works cited

Thẻ

Bình luận

Bài Viết Liên Quan

Học Tăng cường Đa Tác nhân (MARL): Tương lai của Mạng AI-RAN Thông minh và Có khả năng mở rộng

Phát hiện biến động hệ thống ao đầm và hồ tại Hà Nội bằng công nghệ viễn thám và Change Detection

Định Hướng Mê Cung BIM: Xây Dựng Hướng Dẫn Luồng Dữ Liệu Cho Cộng Tác Dự Án Đa Phần Mềm

Xem Nhiều Nhất

EPLAN – Cuộc “cách mạng” trong thiết kế và thi công hệ thống điện

Giới thiệu giải pháp công nghệ mới cho ngành dầu khí, năng lượng

Quản lý bảo trì, bảo dưỡng và sửa chữa cho các thiết bị cơ điện phục vụ sản xuất