OpenAI đã phát hành một mô hình trí tuệ nhân tạo mạnh mới về hiểu ảnh và văn bản, GPT-4, mà công ty gọi là “cột mốc mới nhất trong nỗ lực mở rộng deep learning”.

GPT-4 đã có sẵn cho người dùng trả phí của OpenAI thông qua ChatGPT Plus (với giới hạn sử dụng), và các nhà phát triển có thể đăng ký trên danh sách chờ để truy cập API.

Giá cả là 0,03 đô la cho mỗi 1.000 “prompt” token (khoảng 750 từ) và 0,06 đô la cho mỗi 1.000 “completion” token (một lần nữa, khoảng 750 từ). “Token” đại diện cho văn bản thô; ví dụ, từ “fantastic” sẽ được chia thành các “token” “fan”, “tas” và “tic”. “Token” của phần được cung cấp cho GPT-4 trong khi “token” hoàn thành là nội dung được tạo ra bởi GPT-4.

GPT-4 đã được giấu trong tầm nhìn của mọi người, như thực tế đã được xác nhận hôm nay bởi Microsoft rằng Bing Chat, công nghệ chatbot được phát triển cùng với OpenAI, đang chạy trên GPT-4.

Các nhà sử dụng sớm khác bao gồm Stripe, đang sử dụng GPT-4 để quét các trang web doanh nghiệp và cung cấp một bản tóm tắt cho nhân viên hỗ trợ khách hàng. Duolingo tích hợp GPT-4 vào một cấp độ đăng ký học ngôn ngữ mới. Morgan Stanley đang tạo ra một hệ thống được cung cấp bởi GPT-4 để lấy thông tin từ các tài liệu của công ty và cung cấp cho các nhà phân tích tài chính. Và Khan Academy đang sử dụng GPT-4 để xây dựng trợ giảng tự động.

GPT-4 có thể tạo ra văn bản và chấp nhận đầu vào ảnh và văn bản – một cải tiến so với GPT-3.5, phiên bản trước đó chỉ chấp nhận văn bản – và thực hiện ở “mức độ con người” trên các tiêu chuẩn chuyên nghiệp và học thuật khác nhau. Ví dụ, GPT-4 đạt điểm số khoảng 10% thí sinh đầu bảng trong kỳ thi giả lập đối với luật sư; trong khi đó, điểm số của GPT-3.5 chỉ ở khoảng 10% thí sinh đứng cuối.

OpenAI đã dành sáu tháng để “điều chỉnh lặp đi lặp lại (iteratively aligning)” GPT-4 bằng cách sử dụng những bài học từ chương trình thử nghiệm phản đối nội bộ cũng như ChatGPT, dẫn đến “kết quả tốt nhất từ trước đến nay” về tính chính xác, khả năng điều chỉnh và từ chối vượt ngoài phạm vi, theo công ty giới thiệu. Giống như các mô hình GPT trước đó, GPT-4 đã được đào tạo bằng cách sử dụng dữ liệu có sẵn công khai, bao gồm từ các trang web công khai, cũng như dữ liệu mà OpenAI được cấp phép.

OpenAI đã hợp tác với Microsoft để phát triển một “siêu máy tính” từ đầu trong đám mây Azure, được sử dụng để đào tạo GPT-4.

“Trong một cuộc trò chuyện thông thường, sự khác biệt giữa GPT-3.5 và GPT-4 khá nổi bật,” OpenAI viết trong một bài đăng trên blog thông báo về GPT-4. “Sự khác biệt nổi bật khi độ phức tạp của nhiệm vụ đạt đến một ngưỡng đủ cao – GPT-4 đáng tin cậy hơn, sáng tạo hơn và có khả năng xử lý các chỉ thị tinh vi hơn nhiều so với GPT-3.5.”

Không có nghi ngờ gì rằng, một trong những khía cạnh thú vị hơn của GPT-4 là khả năng của nó để hiểu các hình ảnh cũng như văn bản. GPT-4 có thể đặt chú thích – và thậm chí là giải thích – các hình ảnh tương đối phức tạp, ví dụ như nhận dạng bộ chuyển đổi cáp sạc Lightning từ một bức ảnh chụp chiếc iPhone đang sạc.

Khả năng hiểu hình ảnh chưa có sẵn cho tất cả khách hàng của OpenAI – OpenAI đang thử nghiệm với một đối tác duy nhất, Be My Eyes, để bắt đầu. Được cung cấp bởi GPT-4, tính năng Tình nguyện viên Ảo mới của Be My Eyes có thể trả lời câu hỏi về các hình ảnh được gửi đến nó. Công ty giải thích cách nó hoạt động trong một bài đăng trên blog:

Khả năng hiểu hình ảnh hiện chưa có sẵn cho tất cả khách hàng của OpenAI – OpenAI đang thử nghiệm với một đối tác duy nhất, là Be My Eyes, để bắt đầu. Được cung cấp bởi GPT-4, tính năng Tình nguyện viên ảo (Virtual Volunteer) mới của Be My Eyes có thể trả lời câu hỏi về các hình ảnh được gửi đến nó. Công ty giải thích cách hoạt động trong một bài đăng trên blog:

“Ví dụ, nếu một người dùng gửi một bức ảnh về bên trong tủ lạnh của họ, Virtual Volunteer không chỉ có thể xác định đúng những gì có trong đó, mà còn có thể suy ra và phân tích những gì có thể chuẩn bị được với những nguyên liệu đó. Công cụ cũng có thể đưa ra nhiều công thức nấu ăn cho những nguyên liệu đó và gửi hướng dẫn từng bước cách làm cho người dùng.”

Một cải tiến ý nghĩa hơn trong GPT-4, tiềm năng là công cụ điều khiển được đề cập trước đó. Với GPT-4, OpenAI đang giới thiệu một khả năng API mới, các bản tin “hệ thống”, cho phép các nhà phát triển chỉ định phong cách và nhiệm vụ bằng cách mô tả hướng dẫn cụ thể. Các bản tin hệ thống, cũng sẽ được áp dụng cho ChatGPT trong tương lai, về cơ bản là các hướng dẫn thiết lập tông màu – và thiết lập giới hạn – cho các tương tác tiếp theo của trí tuệ nhân tạo.

Ví dụ, một bản tin hệ thống có thể đọc: “Bạn là một gia sư luôn trả lời theo phong cách Socratic. Bạn không bao giờ đưa ra câu trả lời cho học sinh, nhưng luôn cố gắng đặt câu hỏi đúng để giúp họ học cách suy nghĩ độc lập. Bạn luôn điều chỉnh câu hỏi của mình để phù hợp với sở thích và kiến ​​thức của học sinh, phân tích vấn đề thành các phần đơn giản hơn cho đến khi nó đúng với trình độ của họ.”

Ngay cả với hệ thống tin nhắn và các cải tiến khác, OpenAI thừa nhận rằng GPT-4 vẫn còn nhiều thiếu sót. Nó vẫn “nhầm tưởng” các sự kiện và thỉnh thoảng mắc phải sai lầm trong suy luận, đôi khi rất tự tin. Trong một ví dụ được trích dẫn bởi OpenAI, GPT-4 mô tả Elvis Presley là “con trai của một diễn viên” – một sai lầm rõ ràng.

GPT-4 thông thường thiếu kiến thức về các sự kiện đã xảy ra sau hầu hết các dữ liệu của nó bị cắt ngang (tháng 9 năm 2021), và không học từ kinh nghiệm của mình,” OpenAI đã viết. “Nó đôi khi có thể mắc các lỗi suy luận đơn giản không phù hợp với năng lực trên nhiều lĩnh vực, hoặc quá độ tin tưởng vào các tuyên bố sai rõ ràng từ người dùng. Và đôi khi nó có thể thất bại trong các vấn đề khó giống như con người, chẳng hạn như tạo ra các lỗ hổng bảo mật vào mã nó tạo ra.”

Tuy nhiên, OpenAI cũng lưu ý rằng họ đã cải thiện một số khuyết điểm cụ thể; GPT-4 ít có khả năng từ chối yêu cầu về cách tổng hợp các hóa chất nguy hiểm, ví dụ. Công ty cho biết rằng GPT-4 ít 82% tổng thể hơn là phản hồi yêu cầu cho nội dung “không được phép” so với GPT-3.5 và phản hồi cho các yêu cầu nhạy cảm – chẳng hạn như lời khuyên về y tế và bất cứ điều gì liên quan đến tự tử – theo chính sách của OpenAI nhiều hơn 29%.

Có rất nhiều điều để giải mã với GPT-4. Nhưng OpenAI, đối với phần của mình, đang tiến hành một cách chắc chắn – rõ ràng tự tin trong những cải tiến mà nó đã thực hiện.

“Chúng tôi mong đợi GPT-4 trở thành một công cụ có giá trị trong việc cải thiện cuộc sống của mọi người bằng cách cải thiện cho các ứng dụng, ” OpenAI viết. “Vẫn còn rất nhiều công việc phải làm, và chúng tôi mong đợi cải tiến mô hình này thông qua sự nỗ lực chung của cộng đồng xây dựng, khám phá và đóng góp vào mô hình.”

Nguồn: Techcrunch

Đọc thêm những tin tức công nghệ mới nhất tại đây.

Trải nghiệm Sunteco Cloud tại https://dashboard.sunteco.vn/