Trình tạo hình ảnh văn bản DALL-E, nghệ thuật Trí tuệ nhân tạo (AI)

Rate this post

Người dùng hiện có thể truy cập DALL-E miễn phí và không cần chờ đợi. Điều này không phải là không có giới hạn, nhưng OpenAI sẽ bán tín dụng cho những người dùng tạo ra những bức ảnh yêu thích của họ với sự hỗ trợ của AI.

DALL-E là một mô hình AI tổng hợp hình ảnh học sâu, được đào tạo dựa trên hàng trăm triệu hình ảnh được lấy từ Internet. Mô hình, sử dụng một kỹ thuật được gọi là khuếch tán tiềm ẩn, tìm hiểu và xây dựng các mối quan hệ giữa từ và hình ảnh. Người dùng DALL-E có thể nhập mô tả văn bản, được gọi là lời nhắc và xem mô tả đó được hiển thị trực quan dưới dạng hình ảnh 1024 × 1024 pixel ở hầu hết mọi phong cách nghệ thuật.

Một bức ảnh nghệ thuật do DALL-E tạo ra. Ảnh Ars Technica

Trình tạo ảnh văn bản DALL-E, ảnh nghệ thuật Trí tuệ nhân tạo (AI) 2

Ảnh do DALL-E tạo với lời nhắc “Phi hành gia cưỡi”. Ảnh Ars Technica

Ngoài việc tạo hình ảnh từ văn bản, DALL-E còn có một tính năng gọi là “Outpainting” cho phép người dùng tải lên hình ảnh và mở rộng khung hình của nó bằng cách sử dụng ghép ảnh. Người dùng cũng có thể ghép nhiều ảnh thành một bằng cách tạo cầu nối trực quan giữa các bức ảnh, kết hợp các phong cách vẽ tranh khác nhau nhưng phải cung cấp lời nhắc văn bản để AI biết đó là ảnh gì.

OpenAI đã công bố phiên bản trước của DALL-E vào tháng 1 năm 2021 với những khả năng đáng ngạc nhiên nhưng có những hạn chế rõ ràng. Vào tháng 4 năm 2022, OpenAI đã công bố DALLE-2, một đối tượng thử nghiệm giới hạn gồm 200 nhà nghiên cứu, những người đã ngạc nhiên về khả năng tạo ra những hình ảnh gần như thực tế và mô phỏng chính xác phong cách hội họa. . Sau khi dần dần mở cửa cho nhiều người dùng hơn và thiết lập mô hình định giá vào tháng 7 năm 2022, hơn 1,5 triệu người dùng trên toàn thế giới hiện đang sử dụng DALL-E (được đổi tên từ DALL-E). 2) tạo ra hơn 2 triệu bức ảnh mỗi ngày.

DALL-E là một dịch vụ thương mại và có một số hạn chế. Mặc dù bản dùng thử miễn phí cho các cá nhân, người dùng chỉ nhận được 50 tín dụng mỗi tháng và mỗi bộ 4 lời nhắc văn bản sẽ hết một tín dụng. Người dùng có thể mua thêm 115 khoản tín dụng với giá 15 đô la, 13 xu cho mỗi hành động. Nhưng hãy lưu ý, mọi khung hình phụ được thêm vào hình ảnh trong Outpainting cũng khiến người dùng phải trả một khoản tiền. Trò chơi sáng tạo có thể rất tốn kém nếu người dùng yêu thích những bức ảnh được hỗ trợ bởi AI. Người dùng có thể đăng ký thêm tài khoản miễn phí, nhưng mỗi tài khoản yêu cầu xác minh số điện thoại.

Hình ảnh được tạo bằng DALL-E thuộc sở hữu của OpenAI, nhưng công ty cấp cho người dùng độc quyền “tái tạo và hiển thị” các phiên bản tiếp theo nếu chính sách nội dung được tuân thủ. Vi phạm nội dung sẽ tước quyền sử dụng hợp pháp hình ảnh đã tạo của người dùng.

Trước đó, trang Ars Technica đã giới thiệu một phần mềm AI khác có tên là Stable Diffusion, một mô hình tổng hợp hình ảnh mã nguồn mở tương tự như DALL-En do công ty Stability AI phát triển. Vào tháng 9, Stable Diffusion đã cung cấp phần mềm với một số hạn chế thông qua các kênh mã nguồn mở và trang web thương mại. Giờ đây, DALL-E đã có sẵn cho tất cả mọi người, sự cạnh tranh giữa các mô hình tổng hợp hình ảnh sẽ tăng lên trong tương lai gần.

Theo OpenAI, phản hồi từ người dùng (đặc biệt là các nghệ sĩ) đã giúp tinh chỉnh chất lượng của hình ảnh DALL-E. Người dùng khi sử dụng DALL-E vào đầu năm 2022 và hiện nay cho thấy, sản phẩm có vẻ chính xác và “nghệ thuật” hơn. Hình minh họa trong bài viết được tạo bằng DALL-E từ lời nhắc “trừu tượng đầu người chứa bảng mạch phát sáng”.

Theo Ars Technica

Leave a Reply

Your email address will not be published.