1. Giới thiệu Tổng quan về Gemini 2.5 Pro
Gemini 2.5 Pro, một mô hình trí tuệ nhân tạo (AI) tiên tiến do Google DeepMind phát triển, đã nhanh chóng thu hút sự chú ý của cộng đồng công nghệ và các nhà phát triển. Mô hình này được thiết kế để giải quyết các vấn đề ngày càng phức tạp, thể hiện năng lực vượt trội trong nhiều lĩnh vực, đặc biệt là lập trình, lý luận và xử lý đa phương thức.1 Sự ra mắt của các phiên bản Gemini 2.5 Pro, đặc biệt là phiên bản Gemini 2.5 Pro Preview (I/O Edition) mới nhất, không chỉ đánh dấu một bước tiến quan trọng trong dòng sản phẩm Gemini mà còn thể hiện cam kết của Google trong việc thúc đẩy ranh giới của AI.
Mô hình này được xây dựng dựa trên nền tảng vững chắc của các thế hệ Gemini trước đó, kế thừa và phát huy những điểm mạnh như khả năng đa phương thức tự nhiên và cửa sổ ngữ cảnh dài.1 Với những cải tiến đáng kể, Gemini 2.5 Pro hứa hẹn mang lại những công cụ mạnh mẽ hơn cho các nhà phát triển và doanh nghiệp, cho phép họ đổi mới và xây dựng các ứng dụng AI tiên tiến hơn.3 Báo cáo này sẽ đi sâu phân tích các phiên bản khác nhau của Gemini 2.5 Pro, tập trung làm rõ những điểm mới của phiên bản Gemini 2.5 Pro Preview (I/O Edition), những cải tiến về mặt kỹ thuật, hiệu suất trên các bài kiểm tra tiêu chuẩn, các trường hợp sử dụng minh họa và những nhận định từ cộng đồng chuyên gia.
2. Giải mã “Tính mới” của Gemini 2.5 Pro: Phân biệt các Phiên bản và làm nổi bật phiên bản mới nhất
Để hiểu rõ “có gì mới” trong Gemini 2.5 Pro, điều quan trọng là phải phân biệt giữa hai lần công bố chính gần đây: phiên bản “Experimental” ra mắt vào tháng 3 năm 2025 và phiên bản “Preview (I/O Edition)” được công bố vào ngày 6 tháng 5 năm 2025. Phiên bản I/O Edition chính là phiên bản mới nhất và mang đến những cải tiến cùng trọng tâm cụ thể, tạo nên sự “mới mẻ” đáng chú ý.
- A. Gemini 2.5 Pro Experimental (Công bố tháng 3 năm 2025): Nền tảng Ban đầu
Phiên bản Gemini 2.5 Pro Experimental được giới thiệu là mô hình AI thông minh nhất của Google cho đến thời điểm đó, được thiết kế như một “mô hình tư duy” (thinking model) có khả năng suy luận qua các bước trung gian trước khi đưa ra phản hồi, nhằm nâng cao hiệu suất và độ chính xác.1 - Năng lực cốt lõi:
- Đứng đầu bảng xếp hạng LMArena (đo lường sở thích của con người) với khoảng cách đáng kể.1
- Khả năng lý luận mạnh mẽ trong toán học và khoa học (dẫn đầu GPQA, AIME 2025 mà không cần các kỹ thuật phức tạp tốn kém trong thời gian thử nghiệm) và trên Humanity’s Last Exam (18.8% không sử dụng công cụ).1
- Năng lực lập trình tiên tiến: Xuất sắc trong việc tạo ra các ứng dụng web trực quan hấp dẫn, ứng dụng agentic, chuyển đổi và chỉnh sửa mã. Đạt 63.8% trên SWE-Bench Verified với thiết lập agent tùy chỉnh.1
- Đa phương thức tự nhiên và ngữ cảnh dài: Ra mắt với cửa sổ ngữ cảnh 1 triệu token (dự kiến 2 triệu token), xử lý văn bản, âm thanh, hình ảnh, video và toàn bộ kho mã nguồn.1
- Khả dụng: Google AI Studio, ứng dụng Gemini cho người dùng Advanced, và dự kiến có trên Vertex AI.1
- B. Giới thiệu Gemini 2.5 Pro Preview (I/O Edition – Công bố ngày 6 tháng 5 năm 2025): Phiên bản “Mới nhất” và Trọng tâm
Phiên bản này, Gemini 2.5 Pro Preview (I/O Edition), được xây dựng dựa trên những phản hồi tích cực về khả năng lập trình và lý luận đa phương thức của phiên bản experimental trước đó.5 Đây chính là phiên bản “mới” được tập trung phân tích trong bài viết này.
- Trọng tâm chính: Cải thiện đáng kể năng lực lập trình, đặc biệt là xây dựng các ứng dụng web tương tác hấp dẫn.5
- Những điểm khác biệt chính so với phiên bản Experimental tháng 3 (tạo nên sự “mới mẻ” của phiên bản I/O Edition):
- Cải tiến lập trình có mục tiêu: Không chỉ là cải tiến chung về lập trình; tập trung cụ thể vào phát triển front-end, UI và các yếu tố tương tác.6 Điều này cho thấy sự chuyên môn hóa hoặc đào sâu hơn vào lĩnh vực này so với năng lực rộng hơn của bản phát hành tháng 3.
- Cải tiến Function Calling: Giải quyết trực tiếp phản hồi của nhà phát triển bằng cách giảm lỗi và cải thiện tỷ lệ kích hoạt function calling.6 Đây là một cải tiến thực tế quan trọng để xây dựng các ứng dụng AI mạnh mẽ.
- Dẫn đầu WebDev Arena: Đạt vị trí #1 trên bảng xếp hạng WebDev Arena, vượt qua phiên bản trước đó +147 điểm Elo, một thước đo cụ thể về khả năng phát triển web nâng cao của nó.5
- Model ID cập nhật: gemini-2.5-pro-preview-05-06.6 Phiên bản trước đó 03-25 hiện trỏ đến phiên bản mới hơn này.6
Sự khác biệt giữa hai phiên bản này không chỉ nằm ở ngày phát hành. Phiên bản I/O Edition thể hiện một bước tiến hóa dựa trên phản hồi thực tế, tập trung vào việc nâng cao các khía cạnh cụ thể mà cộng đồng nhà phát triển quan tâm. Việc Google chủ động cập nhật mô hình dựa trên phản hồi từ giai đoạn “Experimental” và từ cộng đồng nhà phát triển (ví dụ: Cursor 5) cho thấy một quy trình phát triển linh hoạt và đáp ứng. Giai đoạn “Experimental” không chỉ là một buổi giới thiệu mà còn là một bài kiểm tra quy mô lớn, cho phép Google thu thập phản hồi quan trọng từ thực tế sử dụng của các nhà phát triển. Phản hồi này đã trực tiếp định hình các cải tiến trong phiên bản I/O Edition, mang lại niềm tin rằng các ý kiến đóng góp có thể ảnh hưởng đến các phiên bản Gemini trong tương lai và các mô hình có khả năng trở nên mạnh mẽ và thiết thực hơn theo thời gian.
Hơn nữa, việc Google nhấn mạnh vào các chiến thắng trên các benchmark cụ thể (ví dụ: WebDev Arena cho phiên bản I/O, LMArena cho phiên bản Experimental) cho thấy việc sử dụng chiến lược các benchmark không chỉ để xác nhận nội bộ mà còn để xây dựng một câu chuyện công khai về thế mạnh của mô hình và tạo sự khác biệt trong một thị trường đông đúc.1 Google lựa chọn các benchmark phù hợp nhất để thể hiện những cải tiến hoặc năng lực mục tiêu của từng phiên bản. Điều này phản ánh sự cạnh tranh gay gắt, nơi ngay cả những ưu thế nhỏ trên các benchmark liên quan cũng được quảng bá mạnh mẽ. Mặc dù người dùng nên xem xét một cách toàn diện các năng lực, những benchmark được làm nổi bật này cung cấp các chỉ số mạnh mẽ về những điểm mạnh cụ thể của mô hình.
Bảng 1: Gemini 2.5 Pro – Trọng tâm và Cải tiến Chính của các Phiên bản (Nhấn mạnh phiên bản I/O Edition mới nhất)
Lĩnh vực Tính năng | Gemini 2.5 Pro Experimental (Tháng 3/2025) | Gemini 2.5 Pro Preview (I/O Edition – Tháng 5/2025 – Mới nhất) |
Trọng tâm chính | Năng lực lý luận và lập trình phức tạp, đa phương thức | Năng lực lập trình nâng cao, đặc biệt cho ứng dụng web tương tác, cải thiện function calling |
Năng lực Lập trình (Chung) | Xuất sắc trong tạo ứng dụng web, agentic, chuyển đổi/chỉnh sửa mã 1 | “Cải thiện đáng kể”, bao gồm chuyển đổi mã, chỉnh sửa mã, phát triển quy trình agentic phức tạp 5 |
Phát triển Web App/UI | Tạo ứng dụng web trực quan hấp dẫn 1 | “Cải thiện có ý nghĩa cho phát triển front-end và UI”, “có khiếu thẩm mỹ web” 5 |
Function Calling | Hỗ trợ (là một phần của năng lực chung) | “Giảm đáng kể lỗi”, “cải thiện tỷ lệ kích hoạt” 6 |
Lý luận (Chung) | “Mô hình tư duy”, dẫn đầu GPQA, AIME 2025, Humanity’s Last Exam 1 | Xây dựng dựa trên năng lực lý luận đa phương thức mạnh mẽ 5, hỗ trợ bởi kiến trúc “mô hình tư duy” |
Hiểu Video | Năng lực đa phương thức tự nhiên 1 | Hiệu suất hàng đầu với 84.8% trên VideoMME benchmark 5 |
Benchmark Chính lúc ra mắt | #1 LMArena, GPQA, AIME 2025, SWE-Bench Verified (63.8%) 1 | #1 WebDev Arena (+147 Elo), VideoMME (84.8%), LiveCodeBench v5 (75.6%) 5 |
Cửa sổ Ngữ cảnh | 1 triệu token (dự kiến 2 triệu) 1 | 1 triệu token 10 |
Model ID (Chính) | gemini-2.5-pro-exp-03-25 10 | gemini-2.5-pro-preview-05-06 6 |
Bảng so sánh này làm rõ sự tiến triển và những cải tiến cụ thể của phiên bản I/O, lý giải tại sao nó được coi là “mới nhất” và đáng chú ý. Nó giúp người dùng hiểu được sự phát triển và những cải tiến có mục tiêu.
3. Phân tích sâu “Có gì mới” trong Gemini 2.5 Pro Preview (I/O Edition – gemini-2.5-pro-preview-05-06)
Phiên bản Gemini 2.5 Pro Preview (I/O Edition), với model ID gemini-2.5-pro-preview-05-06, mang đến một loạt các cải tiến đáng kể, tập trung vào việc nâng cao trải nghiệm và hiệu quả cho các nhà phát triển.
- A. Cách mạng hóa Khả năng Tạo mã và Phát triển Web
Đây là cải tiến nổi bật nhất của phiên bản I/O Edition.5 Giám đốc Điều hành DeepMind, Demis Hassabis, mô tả đây là “mô hình lập trình tốt nhất mà chúng tôi từng xây dựng” với “khả năng lập trình được cải thiện vượt bậc”.13 Trọng tâm chính là xây dựng “các ứng dụng web tương tác hấp dẫn”.5
Năng lực phát triển front-end và UI đã có những cải tiến ý nghĩa.6 Mô hình này có khả năng xây dựng “các ứng dụng web vừa đẹp mắt về mặt thẩm mỹ vừa có chức năng tốt” 5, và được cho là có “khiếu thẩm mỹ thực sự đối với phát triển web”.6 Một ví dụ cụ thể là khả năng thiết kế và lập trình hoạt ảnh UI micro cho ứng dụng ghi âm khởi đầu 6 hay thêm một trình phát video theo phong cách của các ứng dụng khác trong ứng dụng khởi đầu Gemini 95.8
Ngoài UI, các cải tiến còn mở rộng đến các tác vụ lập trình cơ bản như chuyển đổi mã (sửa đổi mã để đạt được mục tiêu cụ thể) và chỉnh sửa mã.5 Khả năng phát triển các quy trình agentic phức tạp cũng được nâng cao, cho phép tạo ra các ứng dụng lập trình agentic tinh vi.5 Một thành viên sáng lập của Cognition lưu ý rằng đây là “mô hình đầu tiên giải quyết được một trong những bài đánh giá của chúng tôi liên quan đến việc tái cấu trúc lớn một backend định tuyến yêu cầu,” và cảm thấy nó giống như một “nhà phát triển cấp cao hơn” nhờ khả năng đưa ra quyết định đúng đắn và lựa chọn các trừu tượng hóa tốt.6
Về mặt benchmark, Gemini 2.5 Pro I/O Edition xếp hạng #1 trên bảng xếp hạng WebDev Arena, vượt qua phiên bản trước đó +147 điểm Elo.5 Điểm số trên LiveCodeBench v5 (tạo mã) cũng tăng từ 70.4% (phiên bản tháng 3) lên 75.6%.9 Những cải tiến này giúp hợp lý hóa quy trình làm việc của nhà phát triển, cho phép tạo mẫu nhanh hơn các ứng dụng web phức tạp và có khả năng hạ thấp rào cản gia nhập để tạo ra các UI tinh vi. - B. Tiên phong trong Năng lực Hiểu Video
Gemini 2.5 Pro I/O Edition đạt hiệu suất hàng đầu với điểm số 84.8% trên benchmark VideoMME, cho thấy khả năng hiểu video ở mức cao nhất.5 Điều này tiếp tục phát huy thế mạnh về đa phương thức tự nhiên và ngữ cảnh dài của Gemini.2
Một trong những trường hợp sử dụng mới được nhấn mạnh là khả năng “Video-to-Code” hay “Video-to-App”. Ứng dụng Video to Learning App trong Google AI Studio minh họa việc tạo ra một ứng dụng học tập tương tác từ một video YouTube duy nhất, với khả năng hiểu video và giao diện người dùng hoàn chỉnh được cải thiện trong mô hình cập nhật.6 Google cũng nhấn mạnh khả năng trích xuất thông tin từ video và tạo ứng dụng dựa trên những gì nó học được.9 Điều này mở ra những hướng đi mới cho việc tạo nội dung, công cụ giáo dục và trải nghiệm tương tác bắt nguồn từ nội dung video, giảm đáng kể công sức thủ công. - C. Tinh chỉnh Function Calling và Tích hợp Công cụ
Đây là một phản hồi trực tiếp đối với nhu cầu của người dùng và là một cải tiến quan trọng cho việc phát triển ứng dụng thực tế. Mô hình mới có “sự giảm thiểu đáng kể trong việc không gọi được công cụ” 5, theo lời của Michael Truell, CEO của Cursor. Đồng thời, “tỷ lệ kích hoạt function calling cũng được cải thiện”.6
Những cải tiến này làm cho Gemini 2.5 Pro trở nên đáng tin cậy và hiệu quả hơn khi được tích hợp vào các hệ thống lớn hơn hoặc khi sử dụng API và công cụ bên ngoài. Điều này rất quan trọng để xây dựng các quy trình agentic mạnh mẽ và có thể dự đoán được, đồng thời nâng cao khả năng “điều khiển” (steerability) của mô hình.13 - D. “Mô hình Tư duy”: Lý luận và Giải quyết Vấn đề Nâng cao
Triết lý cốt lõi của dòng Gemini 2.5 là sử dụng một “quy trình tư duy” nội bộ trong quá trình tạo phản hồi, bao gồm việc lập kế hoạch nhiều bước để giải quyết các tác vụ phức tạp.1 Mặc dù không phải là mới đối với phiên bản I/O Edition, đây là một khía cạnh nền tảng củng cố các năng lực tiên tiến của nó. “Tư duy” được bật theo mặc định nhưng có thể được kiểm soát bằng tham số thinkingBudget.15
Trong phiên bản I/O Edition, khả năng lập trình, hiểu video và quy trình agentic nâng cao là kết quả trực tiếp của khả năng lý luận được cải thiện này. Ví dụ, khả năng của mô hình trong việc đưa ra “các quyết định đúng đắn và lựa chọn các trừu tượng hóa tốt” trong các tác vụ tái cấu trúc phức tạp là một minh chứng cho khả năng lý luận của nó.6 Điều này mang lại độ chính xác cao hơn, xử lý tốt hơn các vấn đề phức tạp, nhiều bước và hiểu biết sâu sắc hơn, đặc biệt trong lập trình, toán học và phân tích dữ liệu.1 Người dùng Gemini Advanced cũng được hưởng lợi từ tính năng Deep Research do 2.5 Pro cung cấp, cho phép tạo các báo cáo toàn diện bằng cách phân tích hàng trăm nguồn.17 - E. Mở rộng Đầu vào Đa phương thức và Làm chủ Ngữ cảnh dài (1 Triệu Token)
Gemini 2.5 Pro tiếp tục hỗ trợ đầu vào đa dạng bao gồm văn bản, âm thanh, hình ảnh và video.1 Cửa sổ ngữ cảnh dài 1 triệu token 1 (với kế hoạch mở rộng lên 2 triệu token 1) cho phép xử lý các bộ dữ liệu khổng lồ, tương đương khoảng 1.500 trang văn bản hoặc 30.000 dòng mã 17, và hiểu toàn bộ kho mã nguồn.1
Điều này tạo điều kiện cho việc phân tích dữ liệu sâu, hiểu các tài liệu phức tạp (hợp đồng pháp lý, hồ sơ y tế) và xử lý các tác vụ lập trình quy mô lớn bằng cách hiểu toàn bộ cơ sở mã.4 Đây là yếu tố quan trọng để duy trì sự mạch lạc trong các tương tác dài và giải quyết vấn đề phức tạp.
Sức mạnh thực sự của Gemini 2.5 Pro Preview (I/O Edition) không chỉ nằm ở những cải tiến tính năng riêng lẻ mà còn ở sự kết hợp hiệp đồng của chúng. Ví dụ, khả năng “tư duy” nâng cao kết hợp với cửa sổ ngữ cảnh lớn, khả năng lập trình cải tiến và hiểu biết video tạo ra những khả năng hoàn toàn mới cho các hệ thống agentic đa phương thức phức tạp. Các cải tiến này không bị cô lập mà hội tụ để cho phép các ứng dụng tinh vi và phức tạp hơn, đặc biệt là các ứng dụng agentic có thể nhận thức, suy luận và hành động trên các phương thức và nguồn dữ liệu khác nhau. Điều này mở ra cơ hội cho các nhà phát triển hình dung và xây dựng các ứng dụng mà trước đây quá phức tạp hoặc đa diện đối với các mô hình AI.
Thêm vào đó, việc Google nhấn mạnh rằng mô hình có “khiếu thẩm mỹ thực sự đối với phát triển web” 6 là một điểm khác biệt tinh tế nhưng quan trọng. Nó cho thấy sự tập trung không chỉ vào việc tạo mã chức năng mà còn bao gồm các khía cạnh về chất lượng UI/UX và sự hấp dẫn trực quan. Điều này có thể đặc biệt hấp dẫn đối với việc tạo mẫu nhanh hoặc đối với các nhà phát triển có thể không phải là chuyên gia thiết kế, giúp hạ thấp rào cản để tạo ra các ứng dụng web bóng bẩy và trao quyền cho các nhà phát triển xem xét các khía cạnh thiết kế sớm hơn và dễ dàng hơn trong quy trình phát triển.
Cuối cùng, trường hợp sử dụng “Video to Learning App” 6 không chỉ là một bản demo; nó báo hiệu một năng lực mới đáng kể trong việc tái sử dụng nội dung do AI điều khiển và tạo ra trải nghiệm tương tác từ nội dung video thụ động. Khả năng này vượt ra ngoài việc tóm tắt hoặc phiên âm video đơn giản, bao hàm việc hiểu nội dung và mục đích của video và biến nó thành một trải nghiệm tương tác. Điều này có tiềm năng to lớn cho giáo dục, tiếp thị và giải trí, có thể mở khóa giá trị đáng kể từ lượng lớn nội dung video có sẵn trực tuyến.
4. Thông số Kỹ thuật và Quyền truy cập cho Nhà phát triển (Tập trung vào Gemini 2.5 Pro Preview I/O Edition)
- A. Các Biến thể Model, ID và Thông số Chính
- Model chính (I/O Edition – Mới nhất): gemini-2.5-pro-preview-05-06.6 Đây là phiên bản được nhấn mạnh trong bài viết này.
- Phiên bản preview trước đó, gemini-2.5-pro-preview-03-25 (phát hành ngày 9 tháng 4 năm 2025 11), hiện trỏ đến phiên bản 05-06, nghĩa là các nhà phát triển sử dụng ID 03-25 sẽ tự động nhận được mô hình cập nhật.6
- Một phiên bản experimental trước đó cũng tồn tại: gemini-2.5-pro-exp-03-25.10
- Giới hạn Token Đầu vào: 1.048.576 token (1 triệu token) cho gemini-2.5-pro-preview-05-06.10
- Giới hạn Token Đầu ra: 65.536 token (64K token) cho gemini-2.5-pro-preview-05-06.10 Đây là một sự gia tăng đáng kể so với 8.192 token của Gemini 1.5 Pro.10 Sự gia tăng này cho phép các phản hồi dài hơn và đầy đủ hơn, rất quan trọng đối với các tác vụ như tạo khối mã lớn, báo cáo chi tiết hoặc giải thích toàn diện mà không bị cắt bớt hoặc cần nhiều lời nhắc nối tiếp.
- Loại Dữ liệu Hỗ trợ (Đầu vào): Âm thanh, hình ảnh, video, văn bản, mã.10
- Loại Dữ liệu Hỗ trợ (Đầu ra): Văn bản.10
- Năng lực Chính (cho gemini-2.5-pro-preview-05-06):
- Đầu ra có cấu trúc: Hỗ trợ 10
- Caching: Hỗ trợ 10
- Function calling: Hỗ trợ 10
- Thực thi mã: Hỗ trợ 10
- Search grounding (Vertex AI): Hỗ trợ 10
- Tư duy (Thinking): Hỗ trợ 10
- System instructions: Hỗ trợ 11
- Context Caching: Hỗ trợ 11
- Tạo hình ảnh: Không được hỗ trợ bởi biến thể model cụ thể này.10 Các model Gemini khác xử lý việc này.
- Tinh chỉnh (Tuning): Không được hỗ trợ cho model preview này.10
- Thời điểm cắt dữ liệu (Knowledge Cutoff): Tháng 1 năm 2025 cho gemini-2.5-pro-preview-05-06.10
- Số lượng Tham số (Parameter Count): Google không công bố.24 Đây là điều điển hình cho các mô hình độc quyền.
- Thông số Kỹ thuật cho Đầu vào Đa phương thức (Vertex AI, gemini-2.5-pro-preview-05-06): 11
- Hình ảnh: Tối đa 3.000 mỗi prompt, kích thước 7MB, PNG/JPEG/WEBP.
- Tài liệu (PDF, TXT): Tối đa 3.000 tệp, 1.000 trang/tệp, 50MB/tệp.
- Video: Khoảng 45 phút (có âm thanh), 1 giờ (không có âm thanh), tối đa 10 video. Nhiều định dạng khác nhau.
- Âm thanh: Khoảng 8.4 giờ (hoặc tối đa 1 triệu token), tối đa 1 tệp. Nhiều định dạng khác nhau.
- Giá cả: Phiên bản 05-06 tiếp tục có cùng mức giá với phiên bản 03-25 trước đó.6
- Đầu vào: $1.25/1 triệu token (ngữ cảnh <=200k), $2.50/1 triệu token (ngữ cảnh >200k).25
- Đầu ra: $10.00/1 triệu token (ngữ cảnh <=200k), $15.00/1 triệu token (ngữ cảnh >200k).25 Đầu ra bao gồm cả token tư duy.
- B. Nền tảng để Xây dựng: Google AI Studio, Vertex AI và Gemini Advanced
- Google AI Studio: Các nhà phát triển có thể bắt đầu xây dựng với Gemini 2.5 Pro cập nhật thông qua Gemini API.5
- Vertex AI: Khách hàng doanh nghiệp có thể sử dụng Gemini 2.5 Pro thông qua Vertex AI.4 Nền tảng này cung cấp các tính năng cấp doanh nghiệp và khả năng MLOps.
- Ứng dụng Gemini (cho người dùng Gemini Advanced): Mô hình cập nhật cũng có sẵn cho người dùng trong ứng dụng Gemini, cung cấp năng lượng cho các tính năng như Canvas.5
- Gemini Advanced cung cấp quyền truy cập mở rộng vào 2.5 Pro (experimental), cửa sổ ngữ cảnh 1 triệu token, Deep Research, tải lên kho mã nguồn và các tính năng phân tích dữ liệu.17
Việc ID model 03-25 trước đó hiện tự động trỏ đến phiên bản 05-06 mới 6 cho thấy một chiến lược cập nhật và quản lý phiên bản API được tính toán kỹ lưỡng của Google. Điều này giảm thiểu sự gián đoạn cho các nhà phát triển và đảm bảo họ luôn sử dụng phiên bản mới nhất (và được cho là tốt nhất) của mô hình preview mà không cần thay đổi mã của họ. Cách tiếp cận này thể hiện cam kết về sự tiện lợi cho nhà phát triển và nâng cấp liền mạch, thúc đẩy trải nghiệm phát triển mượt mà hơn và khuyến khích việc áp dụng nhanh hơn các cải tiến mô hình mới.
Bảng 2: Gemini 2.5 Pro Preview (I/O Edition – gemini-2.5-pro-preview-05-06) – Thông số Kỹ thuật Cốt lõi
Tham số | Đặc điểm kỹ thuật |
Model ID | gemini-2.5-pro-preview-05-06 10 |
Giới hạn Token Đầu vào | 1.048.576 token (1 triệu token) 10 |
Giới hạn Token Đầu ra | 65.536 token (64K token) 10 |
Phương thức Đầu vào Hỗ trợ | Âm thanh, hình ảnh, video, văn bản, mã 10 |
Phương thức Đầu ra Hỗ trợ | Văn bản 10 |
Năng lực Chính Hỗ trợ | Function Calling, Thực thi Mã, Tư duy (Thinking), Đầu ra có cấu trúc, Caching, Search grounding, System instructions, Context Caching 10 |
Năng lực Chính Không Hỗ trợ (bởi biến thể này) | Tinh chỉnh (Tuning), Tạo hình ảnh 10 |
Thời điểm cắt dữ liệu | Tháng 1 năm 2025 10 |
Nền tảng Truy cập Chính | Google AI Studio, Vertex AI, Ứng dụng Gemini (cho người dùng Advanced) 5 |
Bảng này cung cấp một cái nhìn tổng quan nhanh chóng, dễ hiểu về các chi tiết kỹ thuật quan trọng nhất mà một nhà phát triển hoặc người dùng kỹ thuật cần để hiểu các thông số hoạt động của mô hình và cách tương tác với nó.
5. Đánh giá Benchmark Gemini 2.5 Pro: Hiệu suất và Bối cảnh Cạnh tranh (Tập trung vào I/O Edition)
- A. Phân tích Kết quả Benchmark Chính (Tập trung vào I/O Edition nếu có)
- WebDev Arena: Xếp hạng #1, +147 điểm Elo so với phiên bản trước.5 Đo lường sở thích của con người đối với việc xây dựng các ứng dụng web đẹp mắt và có chức năng tốt. Điều này là một chỉ số mạnh mẽ về năng lực của mô hình trong lĩnh vực phát triển web/UI được nhấn mạnh.
- VideoMME: Điểm số hàng đầu 84.8% 5, khẳng định khả năng dẫn đầu trong việc hiểu video.
- Benchmark Lập trình:
- LiveCodeBench v5 (tạo mã): 75.6% cho I/O Edition (tăng từ 70.4% của phiên bản tháng 3).9 So với các đối thủ như o3-mini (74.1%), Grok 3 Beta (70.6%) 23, Gemini 2.5 Pro (I/O) hiện dẫn trước các đối thủ được trích dẫn này.
- SWE-Bench Verified (đánh giá agentic code): 63.8% với agent tùy chỉnh (phiên bản tháng 3).1 Claude 3.7 Sonnet (70.3%) dẫn đầu ở benchmark này.23
- Aider Polyglot (chỉnh sửa toàn bộ tệp): 74.0% (phiên bản tháng 3).23 Phiên bản I/O cho thấy cải thiện 2.5% trên Aider Polyglot.27
- Benchmark Lý luận & Kiến thức (Chủ yếu dữ liệu phiên bản Experimental tháng 3, nhưng là nền tảng cho I/O Edition):
- GPQA Diamond (Hỏi đáp khoa học nâng cao): 84%.1
- AIME 2025 (toán): 86.7%.1
- Humanity’s Last Exam (không công cụ): 18.8%.1
- MMMU (hiểu đa phương thức): 81.7% (phiên bản tháng 3).2 Một so sánh trên Reddit lưu ý rằng phiên bản I/O giảm 2.1% trên MMMU 27, đây là một điểm đáng chú ý về khả năng suy giảm hoặc biến động.
- Ngữ cảnh dài:
- MRCR @128K: 91.5% (phiên bản tháng 3).1
- MRCR @1M: 83.1% (phiên bản tháng 3).2
- LMArena (Sở thích của con người): Gemini 2.5 Pro Experimental (tháng 3) ra mắt ở vị trí #1.1 Phiên bản I/O cũng #1 trên LMArena về Lập trình.13
- B. Vị thế So sánh: Với các Model Gemini Trước đó và Đối thủ trong Ngành
- So với Gemini 2.5 Pro trước đó (Experimental tháng 3): Phiên bản I/O cho thấy những cải tiến có mục tiêu, đặc biệt trong lập trình web (WebDev Arena, LiveCodeBench v5) và hiểu video (VideoMME vẫn là SOTA). Một số benchmark lý luận/đa phương thức chung có thể có những biến động nhỏ.27
- So với Gemini 1.5 Pro: Gemini 2.5 Pro cung cấp token đầu ra cao hơn đáng kể (64K so với 8K).10 Token đầu vào là 1 triệu cho 2.5 Pro so với 2 triệu cho 1.5 Pro.10 2.5 Pro có dữ liệu huấn luyện mới hơn (tháng 1/2025 so với tháng 8/2024 cho 1.5 Pro).20
- So với Gemini 1.0 Pro: Gemini 2.5 Pro vượt trội hơn hẳn về mọi mặt: cửa sổ ngữ cảnh lớn hơn (1 triệu so với 32.8K), token đầu ra cao hơn (64K so với 8K), kiến thức mới hơn, hiệu suất benchmark tốt hơn đáng kể và rẻ hơn cho token đầu vào/đầu ra.21
- So với đối thủ (model OpenAI, Claude, Grok): Gemini 2.5 Pro (tháng 3/tháng 5) nhìn chung dẫn đầu hoặc có tính cạnh tranh cao trong lý luận (GPQA, HLE, AIME), ngữ cảnh dài (MRCR) và hiểu đa phương thức (MMMU) so với các model như o3-mini/o1-pro của OpenAI, Claude 3.7 Sonnet và Grok 3.20 Lĩnh vực lập trình có sự đa dạng: dẫn đầu trên WebDev Arena, LiveCodeBench v5 (I/O Edition) rất mạnh mẽ, trong khi SWE-Bench (tháng 3) cạnh tranh nhưng xếp sau Claude 3.7 Sonnet.23
Mặc dù Gemini 2.5 Pro cho thấy hiệu suất mạnh mẽ trên nhiều benchmark được trích dẫn, cộng đồng AI ngày càng nhận thức được những hạn chế của benchmark.12 Một số benchmark có thể bị “lợi dụng” hoặc không hoàn toàn đại diện cho tiện ích trong thế giới thực. Sự biến động nhỏ về điểm số giữa các phiên bản tháng 3 và tháng 5 trên một số benchmark 27 cũng nhấn mạnh rằng hiệu suất có thể dao động hoặc phụ thuộc vào tác vụ cụ thể. Do đó, một góc nhìn cân bằng là rất quan trọng. Dẫn đầu một benchmark như WebDev Arena là rất có ý nghĩa đối với các mục tiêu đã nêu (ứng dụng web). Tuy nhiên, đối với tiện ích tổng thể, đặc biệt là trong các tương tác phức tạp, nhiều lượt hoặc các tác vụ chuyên biệt, trải nghiệm người dùng trực tiếp và thử nghiệm trong thế giới thực vẫn là tối quan trọng.
Đáng chú ý, việc nhấn mạnh vào LMArena 1 và WebDev Arena 5 – cả hai đều đo lường sở thích của con người – báo hiệu một sự chuyển dịch sang đánh giá các mô hình AI dựa trên các tiêu chí vượt ra ngoài việc hoàn thành tác vụ thô để bao gồm các khía cạnh định tính như khả năng sử dụng, tính thẩm mỹ và tính hữu ích. Xu hướng này phản ánh sự trưởng thành trong đánh giá AI, hướng tới các đánh giá toàn diện hơn kết hợp đánh giá chủ quan của con người, đặc biệt đối với các ứng dụng hướng tới người dùng.
Bảng 3: Gemini 2.5 Pro Preview (I/O Edition – gemini-2.5-pro-preview-05-06) – Tổng quan Hiệu suất Benchmark Chọn lọc
Benchmark | Số liệu/Điểm số | So sánh/Ý nghĩa |
WebDev Arena | #1, +147 Elo so với phiên bản trước (05-06) 5 | Đo lường sở thích của con người về xây dựng ứng dụng web, thể hiện năng lực UI/UX. |
VideoMME | 84.8% (05-06) 5 | Hiệu suất hàng đầu trong hiểu video. |
LiveCodeBench v5 | 75.6% (05-06) 9 | Cải thiện so với 70.4% (phiên bản tháng 3), dẫn trước các đối thủ cạnh tranh được trích dẫn như o3-mini (74.1%).23 |
SWE-Bench Verified | 63.8% (phiên bản tháng 3) 1 | Đánh giá agentic code, Claude 3.7 Sonnet (70.3%) dẫn đầu.23 |
GPQA Diamond | 84% (phiên bản tháng 3) 1 | Hỏi đáp khoa học nâng cao, dẫn đầu so với Grok 3 Beta (80.2%).23 |
AIME 2025 | 86.7% (phiên bản tháng 3) 1 | Toán học nâng cao, cạnh tranh sít sao với o3-mini (86.5%).23 |
MMMU (Multimodal Understanding) | 81.7% (phiên bản tháng 3).2 Có báo cáo giảm nhẹ 2.1% cho phiên bản 05-06.27 | Hiểu đa phương thức, dẫn đầu so với Grok 3 Beta (76.0%).23 |
MRCR @128K / @1M (Long Context) | 91.5% / 83.1% (phiên bản tháng 3) 1 | Hiểu ngữ cảnh dài, vượt trội hơn nhiều so với GPT-4.5 (48.8% @128K).23 |
LMArena (Coding) | #1 (05-06) 13 | Sở thích của con người đối với khả năng lập trình. |
Bảng này cung cấp một cái nhìn tổng hợp về hiệu suất của Gemini 2.5 Pro Preview (I/O Edition) trên các benchmark quan trọng của ngành, cho phép người dùng nhanh chóng đánh giá điểm mạnh của nó và vị thế của nó trong các lĩnh vực liên quan đến nhu cầu của họ.
6. Các Trường hợp Sử dụng Minh họa: Đưa AI Tiên tiến vào Thực tiễn với Gemini 2.5 Pro Preview (I/O Edition)
- A. Chuyển đổi Quy trình Làm việc của Nhà phát triển
- Video to Learning App (Google AI Studio): Tạo một ứng dụng học tập tương tác từ một video YouTube duy nhất, thể hiện khả năng hiểu video và tạo UI được cải thiện của phiên bản I/O Edition.6 Điều này tự động hóa việc tạo ra các công cụ giáo dục và nội dung tương tác từ các tài nguyên video hiện có.
- Dictation Starter App: Minh họa việc phát triển nhanh chóng từ ý tưởng đến ứng dụng với UI hấp dẫn (hoạt ảnh sóng, thiết kế đáp ứng, hiệu ứng di chuột tinh tế), với Gemini 2.5 Pro I/O Edition thiết kế và lập trình các yếu tố UI.6 Điều này giúp tăng tốc quá trình tạo mẫu và phát triển các ứng dụng chức năng, thẩm mỹ.
- Phát triển Tính năng Dễ dàng hơn trong IDE: Tạo các tính năng mới dựa trên tệp thiết kế và các thành phần hiện có, ví dụ: thêm trình phát video theo phong cách của các ứng dụng khác trong ứng dụng khởi đầu Gemini 95, sử dụng năng lực của phiên bản I/O Edition.6 Điều này đơn giản hóa các tác vụ phát triển phổ biến, cho phép các nhà phát triển tập trung vào logic cấp cao hơn.
- Ứng dụng Agentic Code: Giải quyết các vấn đề lập trình phức tạp, như tái cấu trúc một backend định tuyến yêu cầu, với khả năng phán đoán và trừu tượng hóa tốt, được nâng cao trong phiên bản I/O Edition.1 Điều này cho phép các trợ lý lập trình AI tự chủ hơn có thể xử lý các tác vụ lớn hơn, phức tạp hơn.
- Hỗ trợ Lập trình Chung: Chuyển đổi mã, chỉnh sửa, gỡ lỗi, tạo unit test, tự động hóa các tác vụ lặp đi lặp lại với sự hỗ trợ của Gemini 2.5 Pro.5
- B. Cung cấp Năng lượng cho các Ứng dụng Tương tác Thế hệ Tiếp theo
- Ứng dụng Web Trực quan Hấp dẫn: Tận dụng vị trí #1 trên WebDev Arena và “khiếu thẩm mỹ phát triển web” của Gemini 2.5 Pro I/O Edition.5
- Mô phỏng và Hoạt ảnh Tương tác: Các ví dụ từ trang DeepMind (mặc dù có thể có trước phiên bản I/O Edition, chúng thể hiện khả năng của dòng 2.5 Pro): hoạt ảnh cá vũ trụ, trò chơi khủng long, trực quan hóa fractal, biểu đồ dữ liệu kinh tế tương tác, hoạt ảnh boids, mô phỏng hạt.2 Điều này cho phép tạo ra nội dung và công cụ trực quan năng động, hấp dẫn từ các lời nhắc đơn giản.
- Deep Research với Gemini Advanced: Tạo các báo cáo toàn diện, sâu sắc bằng cách phân tích hàng trăm nguồn, với bản tóm tắt âm thanh, được hỗ trợ bởi năng lực của 2.5 Pro.17 Điều này cách mạng hóa quy trình nghiên cứu, tiết kiệm thời gian đáng kể và cung cấp thông tin chi tiết sâu hơn.
- Canvas trong Ứng dụng Gemini: Được cung cấp năng lượng bởi 2.5 Pro cập nhật (I/O Edition) cho các trải nghiệm tương tác, phong phú hơn.5
Các trường hợp sử dụng được làm nổi bật, đặc biệt là những trường hợp liên quan đến việc tạo UI nhanh chóng, video-to-app và thiết kế thẩm mỹ với Gemini 2.5 Pro Preview (I/O Edition), cho thấy một xu hướng hướng tới việc dân chủ hóa việc tạo ra các ứng dụng tương tác, tinh vi. AI đang hạ thấp rào cản gia nhập đối với các tác vụ phát triển phức tạp, trao quyền cho các cá nhân hoặc nhóm nhỏ hơn có thể không có kỹ năng chuyên môn sâu rộng về thiết kế UI/UX hoặc phát triển ứng dụng phức tạp để tạo ra các ứng dụng bóng bẩy và chức năng hơn.
Hơn nữa, khả năng của mô hình không chỉ lập trình chức năng mà còn thiết kế các yếu tố UI với “khiếu thẩm mỹ” 6 chỉ ra một lĩnh vực mới nổi là “Generative UI/UX”. Trong đó, AI đóng một vai trò quan trọng trong các khía cạnh sáng tạo và thiết kế của phát triển ứng dụng, không chỉ là kỹ thuật. Điều này có thể biến đổi vai trò của các nhà thiết kế UI/UX, những người có thể ngày càng làm việc với các công cụ AI để khám phá các tùy chọn thiết kế, tạo mẫu và lặp lại nhanh hơn.
7. Quan điểm từ Cộng đồng và Chuyên gia: Sự Hoan nghênh và Phân tích Phê bình
- A. Sự ủng hộ từ Ngành và Phản hồi Tích cực
Google tuyên bố đã nhận được “phản hồi tích cực áp đảo” về khả năng lập trình và lý luận đa phương thức của Gemini 2.5 Pro nói chung.5 Michael Truell, CEO của Cursor, bày tỏ sự “hào hứng về Gemini 2.5 Pro mới nhất (ám chỉ phiên bản I/O Edition)… giảm đáng kể lỗi gọi công cụ… làm cho 2.5 Pro hiệu quả hơn”.5 Đây là một sự xác nhận mạnh mẽ từ bên thứ ba. Silas Alberti từ đội ngũ sáng lập Cognition cũng ca ngợi mô hình này “đạt hiệu suất hàng đầu trong các bài đánh giá junior-dev của chúng tôi… mô hình đầu tiên giải quyết được một trong những bài đánh giá của chúng tôi liên quan đến việc tái cấu trúc lớn… cảm giác như một nhà phát triển cấp cao hơn”.6 Google cũng nhấn mạnh sự hợp tác với các công ty như Cognition và Replit để thúc đẩy ranh giới của lập trình agentic với phiên bản mới.6
Trước khi có những vấn đề được báo cáo với bản dựng 05-06 tháng 5, người dùng Reddit đã rất ấn tượng với phiên bản experimental tháng 3, đặc biệt là cửa sổ ngữ cảnh 1 triệu token và chất lượng đầu ra, gọi đó là một “bước đột phá”.31 Mô hình được khen ngợi vì khả năng xử lý các tệp PDF lớn và tạo các khóa học.31 Một số người dùng nhận thấy nó thông minh hơn và ít khúm núm hơn các mô hình khác, cung cấp cái nhìn sâu sắc thực sự 32, và một số đã chuyển từ các đối thủ cạnh tranh như Claude sang sử dụng Gemini 2.5 Pro.28 - B. Giải quyết các Mối quan ngại do Người dùng Báo cáo (Chủ yếu đối với bản dựng gemini-2.5-pro-preview-05-06 – I/O Edition)
Mặc dù có những phản hồi tích cực ban đầu, bản dựng gemini-2.5-pro-preview-05-06 (phát hành ngày 6 tháng 5) đã vấp phải một số chỉ trích từ người dùng chuyên nghiệp:
- Vấn đề về Độ trễ và Hiệu suất: Một bài báo từ CTOL.digital 26 báo cáo phản ứng dữ dội từ người dùng: “độ trễ tê liệt,” mô hình “suy nghĩ” lâu hơn 2-4 lần, nhưng đầu ra “ít sắc sảo hơn” hoặc “nông hơn.” Hiệu quả phần cứng không cao cũng được ghi nhận, với việc sử dụng GPU cục bộ chỉ đạt khoảng 30%.26
- Khả năng Tuân theo Hướng dẫn và “Trôi dạt Nhận thức”: Khả năng tuân theo hướng dẫn trong các cuộc trò chuyện nhiều lượt bị suy giảm; mô hình quên các chỉ thị giữa chừng hoặc bỏ qua chúng.9 Các thuật ngữ như “mất trí nhớ hướng dẫn,” “lúng túng với các hướng dẫn cơ bản” đã được sử dụng.26 Mô hình cũng được báo cáo là bỏ qua các phần quan trọng của tệp mã trong các đầu ra dài, dẫn đến các bản dựng bị lỗi.26
- Mối quan ngại về Chất lượng Mã (từ một số người dùng cho bản dựng 05-06): Mô hình bị mô tả là “làm hỏng” mã hiện có bằng các chỉnh sửa sâu rộng và gây hại thay vì các sửa đổi chính xác, và bỏ lỡ các đường dẫn logic rõ ràng trong kiểm thử mã.26
- Thay đổi Tông điệu: “Hình thức hơn Nội dung”: Có báo cáo về việc mô hình trở nên “lịch sự hơn, dài dòng hơn và lảng tránh hơn,” che giấu sự thiếu tiện ích bằng các phản hồi mơ hồ.26
- Lỗi Tải lên: Một số người dùng báo cáo lỗi tải lên sau thời gian sử dụng kéo dài.26
- Đánh giá từ TechRadar (Deep Research với 2.5 Pro): Mặc dù mạnh mẽ, mô hình có thể “suy nghĩ quá nhiều,” đi chệch hướng và tạo ra các báo cáo quá dài, thiếu sự biên tập.30
- So sánh từ Tom’s Guide (có thể là phiên bản tháng 3 so với ChatGPT-4.5): Gemini 2.5 Pro yếu hơn trong việc tóm tắt và viết sáng tạo/thích ứng giọng điệu trong các bài kiểm tra cụ thể, mặc dù mạnh hơn về hậu cần chi tiết và độ chính xác kỹ thuật.33
Những lời chỉ trích về bản dựng 05-06 tháng 5 (chậm hơn, kém sắc sảo, tuân theo hướng dẫn kém hơn, quá lịch sự) 26 là những triệu chứng kinh điển của những gì người dùng thường coi là “nerfing” (giảm sức mạnh) hoặc tác dụng phụ tiêu cực của việc tăng cường sự an toàn hoặc các điều chỉnh mô hình khác. Điều này có thể làm xói mòn lòng tin của người dùng nếu không được quản lý cẩn thận. Các vấn đề này có thể xuất phát từ các điều chỉnh sau huấn luyện, tương tác không tốt của các tính năng mới, vấn đề về cơ sở hạ tầng hoặc các lỗi cụ thể của bản dựng.
Sự tương phản giữa kết quả benchmark mạnh mẽ (ví dụ: WebDev Arena, VideoMME cho phiên bản I/O) và trải nghiệm người dùng tiêu cực được báo cáo cho bản dựng 05-06 tháng 5 26 nhấn mạnh khoảng cách ngày càng tăng giữa hiệu suất kiểm tra tiêu chuẩn và tiện ích thực tế được cảm nhận, đặc biệt đối với các tác vụ tương tác phức tạp. Điều này cho thấy rằng mặc dù các benchmark hữu ích, chúng không kể toàn bộ câu chuyện. Người dùng, đặc biệt là những người dùng kỹ thuật, nên thận trọng khi chỉ dựa vào các tuyên bố benchmark và thử nghiệm thực tế cho các quy trình làm việc cụ thể vẫn rất quan trọng.
8. Ý nghĩa Chiến lược và Triển vọng Tương lai của Gemini 2.5 Pro
- A. Tác động đến Hệ sinh thái Phát triển AI
Khả năng lập trình tiên tiến của Gemini 2.5 Pro Preview (I/O Edition), đặc biệt trong web/UI và các tác vụ agentic, đặt ra một tiêu chuẩn mới cho những gì các nhà phát triển có thể mong đợi từ các đối tác AI. Khả năng hiểu video mạnh mẽ kết hợp với lập trình và lý luận có khả năng sẽ thúc đẩy sự đổi mới trong các ứng dụng kết hợp liền mạch các loại dữ liệu khác nhau. Sự lặp lại nhanh chóng và tập trung vào các tính năng lấy nhà phát triển làm trung tâm của Google sẽ tiếp tục thúc đẩy sự cạnh tranh gay gắt giữa các phòng thí nghiệm AI lớn, mang lại lợi ích cho người dùng bằng các công cụ mạnh mẽ và dễ tiếp cận hơn. - B. Các Cải tiến Dự kiến trong Tương lai
- Mở rộng Cửa sổ Ngữ cảnh lên 2 Triệu Token: Đã được lên kế hoạch 1, điều này sẽ tăng cường hơn nữa khả năng xử lý và suy luận trên lượng lớn thông tin.
- Tiếp tục Tinh chỉnh Năng lực “Tư duy”: Dự kiến sẽ có những cải tiến liên tục về độ chính xác trong lý luận, lập kế hoạch và giải quyết vấn đề.
- Tích hợp Công cụ Rộng hơn và Năng lực Agentic: Cải tiến hơn nữa cho function calling, sử dụng công cụ và khả năng thực hiện các hành động tự chủ, nhiều bước phức tạp hơn.
- Giải quyết Phản hồi của Người dùng: Google có khả năng sẽ làm việc để giảm thiểu các vấn đề về độ trễ và tuân theo hướng dẫn được báo cáo trong các bản cập nhật tiếp theo của bản preview.
- Tiềm năng cho Phiên bản trên Thiết bị hoặc Biến thể Nhỏ hơn: Mặc dù 2.5 Pro là một mô hình lớn, gia đình Gemini bao gồm Nano cho các tác vụ trên thiết bị 3, cho thấy một chiến lược cho các tùy chọn triển khai đa dạng.
Việc nhấn mạnh vào quyền truy cập Vertex AI 4, khả năng lý luận minh bạch của “mô hình tư duy” là “quan trọng đối với niềm tin và sự tuân thủ của doanh nghiệp” 4, và các trường hợp sử dụng như phân tích hợp đồng pháp lý hoặc hồ sơ y tế 4 cho thấy một sự thúc đẩy mạnh mẽ cho việc áp dụng trong doanh nghiệp. Những cải tiến thực tế của phiên bản I/O (lập trình, function calling) càng hỗ trợ điều này. Do đó, có thể kỳ vọng Google sẽ tiếp tục phát triển các tính năng và quan hệ đối tác nhằm củng cố sức hấp dẫn của Gemini đối với khách hàng doanh nghiệp.
Sự phát triển từ Gemini 1.0 lên 1.5, 2.0 Flash và giờ là 2.5 Pro, với các phiên bản experimental và preview (nổi bật là I/O Edition), cho thấy cách tiếp cận phát triển AI lặp đi lặp lại và dài hạn của Google. Họ không chỉ phát hành các mô hình mà còn xây dựng một hệ sinh thái (Gemini API, AI Studio, Vertex AI, tích hợp vào các sản phẩm như Search, Docs, Gmail 3) xung quanh chúng. Đây không chỉ là việc có mô hình “tốt nhất” duy nhất tại bất kỳ thời điểm nào mà là tạo ra một nền tảng AI bền vững, phát triển có thể cung cấp năng lượng cho một loạt các ứng dụng và trải nghiệm.
9. Kết luận: Đánh giá Gemini 2.5 Pro Preview (I/O Edition)
Gemini 2.5 Pro Preview (I/O Edition), với model ID gemini-2.5-pro-preview-05-06, đại diện cho một bước tiến đáng kể trong lĩnh vực trí tuệ nhân tạo. Phiên bản mới nhất này mang đến những cải tiến vượt trội về khả năng lập trình, đặc biệt là trong phát triển ứng dụng web tương tác, hiểu video và function calling. Những nâng cấp này, được xây dựng trên nền tảng “mô hình tư duy” và cửa sổ ngữ cảnh lớn 1 triệu token, mở ra những tiềm năng mới cho các nhà phát triển và doanh nghiệp.
Phiên bản I/O Edition đã chứng minh năng lực dẫn đầu trên các benchmark quan trọng như WebDev Arena và VideoMME, đồng thời giải quyết các phản hồi cụ thể từ cộng đồng nhà phát triển, cho thấy một quy trình phát triển đáp ứng và linh hoạt. Tuy nhiên, những báo cáo ban đầu về các vấn đề liên quan đến độ trễ và khả năng tuân theo hướng dẫn đối với bản dựng 05-06 nhấn mạnh tầm quan trọng của việc thử nghiệm thực tế và sự cần thiết phải cân bằng giữa hiệu suất benchmark và trải nghiệm người dùng trong thế giới thực.
Nhìn chung, Gemini 2.5 Pro, và đặc biệt là phiên bản Preview (I/O Edition), là một minh chứng cho cam kết của Google trong việc thúc đẩy ranh giới của AI. Mặc dù nó thể hiện những khả năng đáng chú ý, đặc biệt là đối với các nhà phát triển, việc tinh chỉnh liên tục dựa trên việc sử dụng trong thực tế sẽ là chìa khóa để hiện thực hóa toàn bộ tiềm năng của nó và duy trì niềm tin của người dùng. Với lộ trình cải tiến liên tục và việc xây dựng một hệ sinh thái mạnh mẽ, Gemini 2.5 Pro hứa hẹn sẽ tiếp tục là một công cụ AI quan trọng, định hình tương lai của các ứng dụng thông minh.
Works cited
- Gemini 2.5: Our newest Gemini model with thinking – Google Blog, accessed May 8, 2025, https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/
- Gemini Pro – Google DeepMind, accessed May 8, 2025, https://deepmind.google/technologies/gemini/pro/
- The Gemini ecosystem – Google AI, accessed May 8, 2025, https://ai.google/get-started/gemini-ecosystem/
- Gemini 2.5 on Vertex AI: Pro, Flash & Model Optimizer Live | Google Cloud Blog, accessed May 8, 2025, https://cloud.google.com/blog/products/ai-machine-learning/gemini-2-5-pro-flash-on-vertex-ai
- Build rich, interactive web apps with an updated Gemini 2.5 Pro – Google Blog, accessed May 8, 2025, https://blog.google/products/gemini/gemini-2-5-pro-updates/
- Gemini 2.5 Pro Preview: even better coding performance – Google …, accessed May 8, 2025, https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
- Google’s Gemini 2.5 Pro update makes the AI model even better at coding – ZDNET, accessed May 8, 2025, https://www.zdnet.com/article/googles-gemini-2-5-pro-update-makes-the-ai-model-even-better-at-coding/
- Gemini 2.5 Pro Preview: even better coding performance – Google Developers Blog, accessed May 8, 2025, https://deepmind.google/discover/blog/gemini-25-pro-preview-even-better-coding-performance/
- Google Unveils Gemini 2.5 Pro Preview (I/O Edition) with Enhanced Coding Capabilities, accessed May 8, 2025, https://theoutpost.ai/news-story/google-unveils-gemini-2-5-pro-preview-i-o-edition-with-enhanced-coding-capabilities-15056/
- Gemini models | Gemini API | Google AI for Developers, accessed May 8, 2025, https://ai.google.dev/gemini-api/docs/models
- Gemini 2.5 Pro | Generative AI on Vertex AI – Google Cloud, accessed May 8, 2025, https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-pro
- Gemini 2.5 Pro Update Boosts Coding Abilities Ahead of Google I/O Splash – CNET, accessed May 8, 2025, https://www.cnet.com/tech/services-and-software/gemini-2-5-pro-update-boosts-coding-abilities-ahead-of-google-io-splash/
- Google debuts an updated Gemini 2.5 Pro AI model ahead of I/O | TechCrunch, accessed May 8, 2025, https://news.futunn.com/hk/post/56446355/google-debuts-an-updated-gemini-2-5-pro-ai-model
- Gemini 2.5 Flash and Pro, Live API, and Veo 2 in the Gemini API – Google Developers Blog, accessed May 8, 2025, https://developers.googleblog.com/en/gemini-2-5-flash-pro-live-api-veo-2-gemini-api/
- Gemini thinking | Gemini API | Google AI for Developers, accessed May 8, 2025, https://ai.google.dev/gemini-api/docs/thinking
- Gemini 2.5 Pro benchmarks released : r/singularity – Reddit, accessed May 8, 2025, https://www.reddit.com/r/singularity/comments/1jjoeq6/gemini_25_pro_benchmarks_released/
- Gemini Advanced – get access to Google’s most capable AI models …, accessed May 8, 2025, https://gemini.google/advanced/
- Gemini Deep Research – your personal research assistant, accessed May 8, 2025, https://gemini.google/overview/deep-research/
- Google introduces Gemini 2.5 Pro with chain-of-thought reasoning built-in – SiliconANGLE, accessed May 8, 2025, https://siliconangle.com/2025/03/25/google-introduces-gemini-2-5-pro-chain-thought-reasoning-built/
- Gemini 1.5 Pro (002) vs Gemini 2.5 Pro – Detailed Performance & Feature Comparison, accessed May 8, 2025, https://docsbot.ai/models/compare/gemini-1-5-pro-002/gemini-2-5-pro
- Gemini 1.0 Pro vs Gemini 2.5 Pro – Detailed Performance & Feature Comparison, accessed May 8, 2025, https://docsbot.ai/models/compare/gemini-1-0-pro/gemini-2-5-pro
- Gemini 2.5 Pro: Google’s brightest AI – Swiftask, accessed May 8, 2025, https://www.swiftask.ai/blog/gemini-2-5-pro
- Gemini 2.5 Pro: Features, Tests, Access, Benchmarks & More | DataCamp, accessed May 8, 2025, https://www.datacamp.com/blog/gemini-2-5-pro
- Google Gemini 2.5 Pro vs DeepSeek V3.1: The 2025 AI Model Showdown – MPG ONE, accessed May 8, 2025, https://mpgone.com/google-gemini-2-5-pro-vs-deepseek-v3-1-the-2025-ai-model-showdown/
- Gemini 2.5 Pro: A Comparative Analysis Against Its AI Rivals (2025 Landscape) – Dirox, accessed May 8, 2025, https://dirox.com/post/gemini-2-5-pro-a-comparative-analysis-against-its-ai-rivals-2025-landscape
- “Slower, Vaguely Smarter?” – Gemini 2.5 Pro 05-06 Faces Backlash …, accessed May 8, 2025, https://www.ctol.digital/news/gemini-2-5-05-06-pro-slow-performance-instruction-issues/
- Benchmark of updated gemini 2.5 pro : r/Bard – Reddit, accessed May 8, 2025, https://www.reddit.com/r/Bard/comments/1kg8iyl/benchmark_of_updated_gemini_25_pro/
- o1 pro vs Gemini 2.5 pro Reasoning/Intelligence Benchmarks : r/ChatGPTPro – Reddit, accessed May 8, 2025, https://www.reddit.com/r/ChatGPTPro/comments/1jq9dzo/o1_pro_vs_gemini_25_pro_reasoningintelligence/
- Gemini 2.5 Pro’s Coding Just Got EVEN Better – YouTube, accessed May 8, 2025, https://www.youtube.com/watch?v=uMOAhHcK2VM
- I tried using the Deep Research feature with Google’s Gemini 2.5 Pro model, and now I wonder if an AI can overthink | TechRadar, accessed May 8, 2025, https://www.techradar.com/computing/artificial-intelligence/i-tried-using-the-deep-research-feature-with-googles-gemini-2-5-pro-model-and-now-i-wonder-if-an-ai-can-overthink
- Man, the new Gemini 2.5 Pro 03-25 is a breakthrough and people don’t even realize it., accessed May 8, 2025, https://www.reddit.com/r/singularity/comments/1jl1eti/man_the_new_gemini_25_pro_0325_is_a_breakthrough/
- Gemini 2.5 Flash | Hacker News, accessed May 8, 2025, https://news.ycombinator.com/item?id=43720845
- I tested ChatGPT-4.5 vs. Gemini Pro 2.5 with 5 prompts — and the …, accessed May 8, 2025, https://www.tomsguide.com/ai/i-tested-chatgpt-4-5-vs-gemini-pro-2-5-with-5-prompts-and-the-results-surprised-me
Bình luận