Tại sự kiện Google I/O 2024 vừa qua, Google đã “chiêu đãi” các nhà phát triển công nghệ cùng người dùng hàng loạt sản phẩm công nghệ AI mới với nhiều cải tiến nâng cao. Cùng Network Hub tìm hiểu các sản phẩm công nghệ AI này nhé!
1. Sơ lược sự kiện công nghệ Google I/O 2024
Google I/O là gì?
Google I/O là hội nghị thường niên của tập đoàn tìm kiếm lớn nhất thế giới – Google được bắt đầu vào 2008. Từ “I” và “O” viết tắt của input/output, và “Innovation in the Open”.
Google I/O nơi các nhà phát triển được cập nhật về công nghệ mới nhất để cải thiện ứng dụng và các dịch vụ khác cho hệ sinh thái Google, cụ thể như Android, Chrome, Chrome OS, Google APIs, Google Web Toolkit, App Engine…Đây cũng là một trong những sự kiện quan trọng nhất để ra mắt các sản phẩm mới từ Google.
Google I/O 2024 được tổ chức khi nào và ở đâu?
Google I/O 2024 được tổ chức tại Hà Nội vào rạng sáng 15.05.2024. Tại sự kiện, “Gã khổng lồ công nghệ” – Google đã ra mắt hàng loạt các sản phẩm AI, gồm các mô hình ngôn ngữ lớn (LLM) với hàng chục tỷ tham số, cho đến các mô hình nhỏ hơn có thể chạy cục bộ trên thiết bị cho người dùng cuối.
2. Có gì mới tại Google I/O 2024?
Gemma 2 với 27 tỷ tham số
Gemma 2 là phiên bản mới với những nâng cấp đáng kể hơn, có tận 27 tỷ tham số, so với phiên bản Gemma trước đó chỉ có hai phiên bản với 2 tỷ tham số và 7 tỷ tham số. Mô hình này đã được tối ưu để chạy trên GPU thế hệ tiếp theo của NVIDIA, máy chủ Google Cloud TPU và dịch vụ Vertex AI.
Mô hình mới này đã được Josh Woodward – Phó chủ tịch Google Labs thông báo rằng sẽ “mạnh gấp đôi” so với các mô hình nguồn mở như Llama của Meta và Mistral của Mistral AI, đồng thời công bố Gemma 2 được dự kiến sẽ triển khai vào tháng 6 năm nay.
Các mô hình AI mới của Gemini
- Gemini 1.5 Pro
Mô hình AI này sẽ trở thành trợ lý đa năng chính cho Workspace của Google, chủ yếu trong các dịch vụ Google Docs, Sheets, Slides, Drive và Gmail. Gemini 1.5 Pro được đào tạo để có thể lấy thông tin từ bất kỳ nội dung từ Drive sau đó tổng hợp và tóm tắt, viết email kết hợp thông tin từ tài liệu đang xem.
Hiện nay, tính năng này vẫn đang dành cho người dùng có trả phí và trong tương lai có thể mở rộng cho tất cả người dùng. Bạn có thể truy cập vào Gemini 1.5 Pro thông qua đăng ký sử dụng có trả phí của Gemini Advance.
- Gemini 1.5 Flash
Mặc dù vẫn chưa có nhiều tiết lộ về mô hình này nhưng Gemini 1.5 Flash đã được công bố là mô hình đa phương thức mới mạnh mẽ như Gemini 1.5 Pro nhưng được “tối ưu hóa cho các tác vụ hẹp, tần suất cao, độ trễ thấp” – theo blog.google. Đây là yếu tố giúp AI này phản hồi nhanh hơn và chuẩn xác hơn.
- Gemini Live
Là tính năng mới nhằm giúp người dùng đối thoại với Gemini được lưu loát và mượt mà hơn. Gemini Live được được cập nhật thêm phần cá tính vào giọng nói chatbot cho cuộc trò chuyện với người dùng thêm sinh động, đồng thời tính năng này cho phép bạn ngắt lời của AI thay vì phải đợi từng lượt phản hồi.
Bên cạnh đó, bạn cũng có thể yêu cầu Gemini Live mở camera để nhìn thấy sự vật bạn muốn trao đổi với nó và yêu cầu nó cung cấp thông tin về sự vật đó.
- Gemini Nano
Mô hình AI nhỏ gọn nhất lần này sẽ được Google tích hợp tính năng hỗ trợ trên Workspace Lab như Gmail hay Google Doc, viết cho các bài đăng trên mạng xã hội, viết email hoặc giúp bạn tạo văn bản ngắn một cách nhanh chóng. Gemini Nano sẽ được Google đưa vào trình duyệt Chrome cho máy tính bàn từ phiên bản 126.
Ngoài ra, Google cũng sẽ đưa mô hình này vào Android trên smartphone. Điều này cũng là một giải pháp tối ưu để bảo vệ người dùng tránh xa các cuộc gọi lừa đảo, vì Gemini Nano có thể nhận biết các cuộc gọi này qua những dấu hiệu nguy hiểm thông qua các dữ liệu về các kiểu trò chuyện phổ biến của kẻ lừa đảo, sau đó đưa ra cảnh báo theo thời gian thực qua cách trò chuyện.
- Gemini Imagen 3
Song song sự nâng cấp về xử lý văn bản, Google cũng đưa ra Gemini Imagen 3 với những cải tiến nâng cao về mảng xử lý hình ảnh. Công nghệ AI này có khả năng hiểu câu lệnh tốt hơn và tạo ra những hình ảnh có độ sắc nét, chân thật hơn, đồng thời giảm thiểu các vấn đề về lỗi khi tạo ảnh. Google tuyên bố Imagen 3 “có khả năng tạo ảnh từ văn bản hiệu quả nhất hiện nay”.
Gemini AI được tích hợp vào các dịch vụ của Google
- Workspace
Gemini AI phiên bản Gemini 1.5 Pro mới được thông báo sẽ tích hợp vào Workspace và Chrome của Google nhằm tối ưu hiệu suất làm việc của các dịch vụ, bao gồm khả năng phân tích văn bản, code, video, đoạn ghi âm với thời lượng dài hơn trước,…
- Google Search
Google Search cũng được tích hợp Gemini, công nghệ AI này sẽ đưa ra những phản hồi có tính chính xác cao và tối ưu hơn, khi không đơn giản chỉ đưa ra thông tin kèm liên kết trích dẫn mà còn có thể trả lời câu lệnh theo ngôn ngữ tự nhiên, đính thêm các thông tin liên quan và gợi ý nội dung mới dựa trên từ khóa
- Google Photos
Không dừng lại ở đó, Gemini AI cũng được đưa vào Google Photos nhằm phục vụ khả năng sàng lọc ảnh theo yêu cầu người dùng qua câu hỏi, được gọi là Aks Photos. Tại Google I/O 2024, CEO Sundar Pichai đã thực hiện mẫu tính năng bằng cách hỏi Gemini biển số xe của ông là gì. Câu trả lời là dãy số nhưng kèm một bức ảnh để ông chắc chắn rằng câu trả lời là đúng.
- Google Maps
Tính năng này sẽ được tích hợp mô hình AI Gemini và API Places. Với những nâng cấp mới, các nhà phát triển Google Maps sẽ không cần tự viết mô tả địa điểm mà thay vào đó AI sẽ giúp bạn tiết kiệm thời gian hơn qua việc tóm tắt thông tin các địa điểm và khu vực trong ứng dụng của bạn dựa trên dữ liệu đào tạo là 300 triệu đánh giá các địa điểm.
- Google Assistant
Google cho biết họ đang dần đưa Gemini AI thành “trợ lý ảo thông minh” thay cho Google Assistant. Mô hình AI này có khả năng đưa ra các câu trả lời nhanh, đủ thông tin và mang tính tương tác tốt hơn so với trợ lý ảo Assistant. Bên cạnh đó, Google cũng mong muốn để Gemini AI hỗ trợ người dùng thực hiện những tương tác sâu hơn và hiệu quả hơn.
3. Gems
Tương tự với GPT của OpenAI, AI Chatbot Gems cho phép người dùng được cá nhân hóa Gemini bằng cách đưa ra những hướng dẫn cho nó, từ đó có thể tùy chỉnh các phản hồi và chuyên môn của nó cho phù hợp với mình. Chẳng hạn, nếu nhà phát triển muốn nó trở thành một huấn luyện viên chạy bộ và kiên định với mục tiêu này, AI sẽ đề xuất các bước thực hiện. Tuy nhiên, tính năng chỉ dành cho tài khoản trả phí Gemini Advanced.
4. AI sẽ được tích hợp sâu hơn vào Android
“Ông lớn” Google cho biết sẽ cập nhật thêm công nghệ AI thông minh vào Android. Bên cạnh mô hình AI Gemini Nano vừa được nêu trên, sắp tới người dùng Android có thể đặt câu hỏi về video trên màn hình, và nó sẽ trả lời dựa trên phụ đề tự động. Đối với người dùng Gemini Advanced bản trả phí, nó cũng có thể đọc PDF và cung cấp thông tin.
Một tính năng mới khác sẽ được cập nhật trên Android dùng trên smartphone, được gọi là Circle to Search. Bạn có thể khoanh vùng thông tin cần được giải quyết trên hình ảnh, AI sẽ nhận biết và hỗ trợ bạn nhanh chóng. Ví dụ, bạn cần giải 1 bài toán, hãy vẽ vòng tròn quanh một bài toán trên màn hình và bạn sẽ nhận được trợ giúp từ AI để giải quyết bài toán với lời giải rõ ràng, chi tiết.
5. Veo
Theo Demis Hassabis, CEO Google DeepMind, Veo là một công cụ AI có khả năng tạo video chất lượng cao với độ phân giải 1080p với nhiều phong cách khác nhau. Ngoài ra, đây cũng có thể xem là “lời đáp trả” của Google với Soha.
Veo có khả năng hiểu câu lệnh với ngôn ngữ tự nhiên, từ đó tạo ra các video sát sao với những yêu cầu sáng tạo của người dùng, đồng thời công nghệ AI này cũng hiểu được các thuật ngữ trong điện ảnh. Một điểm cộng khác của Veo đó là có thể tạo ra cảnh nhất quán và mạch lạc, với các chủ thể con người, động vật và đồ vật chuyển động chân thực trong suốt cảnh quay.
Được biết, hiện cả Veo và Gemini Imagen 3 đều chưa được phát hành rộng rãi. Google đang dự kiến sẽ đưa một số tính năng của Veo vào YouTube Shorts và các sản phẩm khác trong tương lai.
6. Dự án Astra
Tại sự kiện Google I/O 2024, Google đã giới thiệu dự án Astra – một công nghệ AI đa phương thức được kỳ vọng sẽ “làm được mọi thứ” như một trợ lý ảo đa năng.
Astra hoạt động thông qua camera trên điện thoại, mô hình AI này có thể xem và hiểu những gì nó thấy qua lăng kính, đặc biệt có khả năng ghi nhớ vị trí của vật và đáp ứng mọi yêu cầu của người dùng.
Google cho biết, mục tiêu của công cụ là trở thành một tác nhân AI “trung thực nhất và tốt nhất”. Đại diện Google chia sẻ thêm “Nó không chỉ nói chuyện với người dùng mà còn thực sự làm mọi việc thay mặt bạn”.
Xem thêm:
- Chuyển văn bản thành giọng nói bằng AI cho bệnh nhân bị mất giọng
- 7 AI Chatbot ngoài ChatGPT mà có thể bạn chưa biết?
- EVOL G Series – Dòng laptop gaming Colorful mới giới thiệu có gì?
Vừa rồi là những thông tin về những sản phẩm công nghệ AI mới tại Google I/O 2024. Hãy thường xuyên theo dõi trang Tin tức của Network Hub để cập nhật thêm những thông tin bổ ích!