Trong khi OpenAI vẫn chưa phát hành tính năng đa phương thức được mong chờ nhất của GPT-4, cho phép bạn tải lên hình ảnh và đặt câu hỏi liên quan đến chúng, không ngạc nhiên, Microsoft đã tung ra truy cập sớm vào tính năng tải ảnh lên. Vâng, bạn hiện có thể tải lên hình ảnh lên Bing Chat và trò chuyện với mô hình GPT-4. Nó hoạt động hoàn toàn giống như OpenAI đã thể hiện trong lễ ra mắt GPT-4.
Với tính năng đa phương thức, Bing Chat thực tế đã có khả năng thị giác, và nó hiện có thể hiểu hình ảnh. Bạn có thể sử dụng nó để nghiên cứu báo cáo y tế, thu thập dữ liệu dinh dưỡng về thực phẩm, giải các câu hỏi toán học và nhiều việc khác nữa. Bây giờ, để tìm hiểu cách sử dụng khả năng đa phương thức của GPT-4 trong Bing Chat, hãy làm theo hướng dẫn sau đây.
1. Đầu tiên, mở Microsoft Edge và truy cập vào Bing trên máy tính của bạn. Bạn cũng có thể cài đặt ứng dụng Bing (miễn phí, dành cho Android và iOS) trên điện thoại thông minh của mình.
2.Tiếp theo, nhấp vào "Chat" ở góc trên bên trái.
3. Sau đó, chuyển sang chế độ "Sáng tạo" vì nó cho phép bạn trò chuyện miễn phí với mô hình GPT-4.
4. Bây giờ, bạn sẽ thấy một nút "ảnh" trong trường văn bản ở dưới. Điều này sẽ cho phép bạn tải lên một hình ảnh và truy cập vào tính năng đa phương thức của GPT-4.
5. Nhấp vào nút ảnh và tải lên một tệp hình ảnh. Bạn cũng có thể dán URL của hình ảnh nếu bạn muốn.
6. Tôi đã tải lên một hình ảnh của một trang web mà tôi vẽ nhanh trên một tờ giấy. Bây giờ, chúng ta hãy yêu cầu Bing Chat tạo ra một trang web giống như thế này và tạo mã HTML và CSS cho trang web.
7. Và đúng vậy, bạn đã có nó. Dựa trên GPT-4, Bing Chat sử dụng khả năng đa phương thức của nó để tạo mã HTML và CSS ngay lập tức.
8. Sau khi dán mã và chạy nó, đây là trang web bạn thu được. Không tồi, phải không? Nó đã chính xác nhận diện viết tay của tôi và bố cục cũng tương tự. Đó là cách khả năng đa phương thức của GPT-4 trong Bing Chat hoạt động.
9. Trong một ví dụ khác, tôi đã tải lên một thiết kế CAD phức tạp của một ngôi nhà và đặt cho nó một số câu hỏi, từ số lượng sắt đến các câu hỏi liên quan đến thiết kế, và nó đã thực hiện công việc tuyệt vời.
10. Tiếp theo, tôi đã yêu cầu Bing Chat giải hai câu hỏi toán học, và nó đã giải đúng cả hai câu hỏi.
11. Cuối cùng, để tổng kết, tôi đã tải lên một hình tranh vui và yêu cầu Bing Chat giải thích trò đùa. Nhưng lần này, nó không thể hiểu được trò đùa. Tuy nhiên, tính năng đa phương thức của GPT-4 thực sự mạnh mẽ và có vô số trường hợp sử dụng mà bạn có thể thử nghiệm.