Stable Diffusion là một hệ thống dựa trên deep learning được phát hành vào năm 2022Tạo văn bản AI thành hình ảnhmô hình, chủ yếu được sử dụng để tạo ra hình ảnh và hình minh họa chi tiết dựa trên mô tả văn bản, được phát triển bởi công ty khởi nghiệp StabilityAI phối hợp với một số nhà nghiên cứu hàn lâm và tổ chức phi lợi nhuận.
Stable Diffusion là mô hình khuếch tán tiềm ẩn (Latent Diffusion Model) – một loại mạng lưới thần kinh sinh sản sâu. Mã và trọng lượng mô hình của Stable Diffusion được phát hành công khai và có thể chạy trên hầu hết phần cứng máy tính được trang bị GPU khiêm tốn, trong khi các mô hình đồ thị Vincent độc quyền trước đây như DALL-E và Midjourney chỉ có thể truy cập được thông qua dịch vụ điện toán đám mây.
Phiên bản trực tuyến Khuếch tán ổn định chủ yếu có thể truy cập được thông qua các trang web chính thức sau:
- Phiên bản DreamStudio(Được chính thức ra mắt bởi StableAI)
- Khuếch tán ổn định XL (Ra mắt bởi ClipDrop, một công ty con của StabilityAI)
- Nghệ nhân ổn định(Dịch vụ phiên bản Discord do StabilityAI ra mắt)
Phương pháp triển khai cục bộ Khuếch tán ổn định có sẵn thông qua các công cụ sau:
- Trình khởi chạy thế giới sơn(Phiên bản máy tính để bàn khởi chạy Stable Diffusion-WebUI được sản xuất và phát hành miễn phí bởi bậc thầy Bilibili UP @秋叶aaaki)
- Gói tích hợp Khuếch tán ổn định(Để biết chi tiết, xem Cách sử dụng Khuếch tán ổn định – Phương pháp 2)