Các phần mềm trí tuệ nhân tạo (AI) chuyển văn bản thành hình ảnh như Midjourney, Dall-E và Stable Diffusion đang làm thay đổi cách tiếp cận với sáng tạo và quá trình lên ý tưởng của các kiến trúc sư.
Trong năm qua, một số công ty công nghệ đã ra mắt phần mềm sử dụng AI mạng thần kinh (neural-network) để chuyển đổi văn bản đầu vào của người dùng trở thành những hình ảnh ở đầu ra.
Nhanh chóng nắm bắt “hồn” dự án
Bill Cusick, Giám đốc sáng tạo của Stability AI, công ty phát hành phần mềm chuyển văn bản thành hình ảnh - Stable Diffusion và DreamStudio, cũng là người có kinh nghiệm làm việc với ứng dụng trực quan hoá phổ biến Midjourney. Ông tin rằng các phần mềm AI chính là “nền tảng của sự sáng tạo trong tương lai”.
“Tôi cảm nhận được một sự vui thích trong thiết kế mà chúng ta chưa từng biết trước đây về mặt thiết kế kiến trúc và kết xuất đồ hoạ (rendering)”, Cusick cho hay. “Công nghệ này giúp nắm bắt tầm nhìn của dự án một cách nhanh chóng”.
Andrew Kudless, nghệ danh Matys Design, cho rằng công nghệ AI có thể trở nên thiết yếu trong giai đoạn đầu của các dự án, khi nó có thể hỗ trợ con người phác thảo và sáng tạo ý tưởng.
“Bất cứ khi nào tôi phác thảo bằng bút chì, tôi không lo lắng liệu cái cột hay bất cứ thứ gì có ở đúng vị trí hay không”, Kudless nói. “Chính xác hay chính xác tuyệt đối không phải mục đích của việc phác thảo. Ý nghĩa của nó là nắm bắt tầm nhìn của dự án một cách nhanh chóng”.
Giảm độ trễ từ ý tưởng đến hành động
Manas Bhatia, nhà thiết kế người Ấn Độ, sử dụng Midjourney để phác thảo cảnh quan thành phố tương lai, mô tả sự tích hợp phức tạp của các cấu trúc và thiên nhiên, cũng đồng tình với ý kiến trên.
“AI có tiềm năng to lớn trong việc giải quyết sự chậm trễ từ suy nghĩ đến thực hiện. Hiện tại chúng ta đang thấy các nhà thiết kế và chuyên gia sáng tạo sử dụng AI cho mục đích tạo ý tưởng, nhưng theo thời gian, AI sẽ trở thành một phần quan trọng trong thiết kế tổng thể”, Bhatia nhận định.
Các nhà thiết kế thừa nhận phần mềm có khả năng thay đổi cách thức thực hiện lao động trong các văn phòng thiết kế và kiến trúc. “Đôi lúc tôi cảm thấy thất vọng khi một lượng lớn công sức, đặc biệt là của những nhân viên trẻ tuổi, phải bỏ ra để sản xuất hình ảnh render trên văn phòng. Tôi nghĩ nếu chúng ta có thể tự động hoá một số bước mà vẫn nắm sự chủ động kiểm soát thì sẽ tốt hơn”, Kudless cho hay.
Cusick đồng ý việc công nghệ sản xuất hình ảnh bằng việc sử dụng các khái niệm thẩm mỹ, kết hợp với các hình mẫu theo những cách giàu trí tưởng tượng, tạo ra tiềm năng to lớn để giải phóng sức lao động ở giai đoạn thiết kế ban đầu.
Trong khi đó, Kudless tin rằng phần mềm chuyển văn bản thành hình ảnh là công cụ mạnh mẽ không chỉ đơn thuần mang tính thay thế cho kiến trúc sư, do ứng dụng này yêu cầu người dùng cần kiến thức và kỹ năng để tạo ra kết quả hữu ích.
Các hệ thống AI sử dụng văn bản để tạo ra hình ảnh không thực sự hiểu ngôn ngữ như con người, mà thường tập trung vào các danh từ và tính từ phụ hoặc tệ hơn là hiểu sai ngữ cảnh. Bởi vậy, việc chọn từ ngữ phù hợp để tạo ra thứ gì đó có giá trị đòi hỏi sự khéo léo.
“Phần mềm này là công cụ cần có con người để hoạt động”, Bhatia giải thích. “AI tạo ra hình ảnh dựa trên ý tưởng của nhà thiết kế cung cấp dưới dạng văn bản và ý tưởng đó sẽ thay đổi từ người dùng này sang người dùng khác”.
Tiềm năng nhưng còn sơ khai với thiết kế công nghiệp
Dan Harden, nhà thiết kế tại công ty thiết kế công nghiệp Whipsaw nói rằng AI đang dần bước vào lĩnh vực này, tuy nhiên mới ở mức độ sơ khai. “Không giống như thiết kế kỹ thuật số, nơi AI được tích hợp vào nền tảng phần mềm thông thường, việc thiết kế sản phẩm phần cứng lại khác”.
“Các khía cạnh ba chiều của một sản phẩm và mối quan hệ của nó với người dùng, cũng như môi trường bên ngoài nơi nó được sử dụng, tạo ra thách thức theo cấp số nhân với AI, chủ yếu là do công nghệ AI không thể cảm nhận được những sắc thái tác động của người dùng trong thế giới vật chất mà sản phẩm được sử dụng”, chuyên gia thiết kế này giải thích.
Sai lệch thiên vị
Một trong những vấn đề lớn nhất của công nghệ chuyển văn bản thành hình ảnh là chúng thường có xu hướng thiên vị, gây ra bởi việc sử dụng nhóm hình ảnh sẵn có để tạo ra hình ảnh trực quan mới.
Theo Kudless, một số phong cách kiến trúc nhất định thường bị thể hiện quá mức, cùng với đó là hình ảnh tạo bởi kỹ thuật số trái ngược với nhiếp ảnh. Thành kiến tạo ra bởi việc tập trung vào một kiến trúc duy nhất mà bỏ qua những phong cách còn lại.
“Chúng tôi cần đảm bảo rằng phần mềm có đủ dữ liệu để không tạo ra vòng phản hồi lặp này, cũng như việc trở nên tốt hơn cả ở những nội dung mà người dùng không hỏi tới”, ông nói.
Để giải quyết vấn đề này, các chuyên gia trong lĩnh vực đang xem xét sử dụng trình chuyển đổi hình ảnh sang hình ảnh, cho phép kiến trúc sư nhập đầu vào nhiều phong cách khác nhau chỉ với 1 hình ảnh để tạo ra một hỗn hợp tổng hợp, từ đó làm giảm thiểu sự thiên vị của các mạng lưới thần kinh.
Thế Vinh (Theo DeZeen, DesignWanted)