ओपनएआई का टेक्स्ट-टू-वीडियो जनरेटर एआई मॉडल सोरा आने वाले महीनों में जनता के लिए उपलब्ध होगा। ओपनएआई की मुख्य प्रौद्योगिकी अधिकारी, मीरा मुराती ने द वॉल स्ट्रीट जर्नल के साथ एक साक्षात्कार में कहा कि एआई संचालित वीडियो जेनरेशन मॉडल जनता के लिए “निश्चित रूप से इस वर्ष”, संभवतः “कुछ महीनों” में उपलब्ध कराया जाएगा।
कंपनी के अन्य उत्पादों जैसे ChatGPT और DALL-E की तुलना में सोरा के लिए आवश्यक कम्प्यूटेशनल शक्ति से संबंधित एक प्रश्न का उत्तर देते हुए, मुराती ने कहा कि वीडियो जेनरेशन मॉडल वर्तमान में एक “शोध आउटपुट” है और “बहुत अधिक महंगा” है। उन्होंने आगे कहा, कंपनी वर्तमान में सोरा को अनुकूलित करने पर काम कर रही है ताकि इसे जनता के लिए “उसी कीमत पर उपलब्ध कराया जा सके जो हमने DALL-E के साथ देखा था।”
मुराती ने कहा कि कंपनी “गलत सूचना और हानिकारक पूर्वाग्रह के मुद्दों” पर विचार कर रही है, जो वीडियो जनरेटर के कारण हो सकता है, खासकर नवंबर में अमेरिकी चुनाव के साथ। उन्होंने कहा, “हम ऐसी कोई भी चीज़ जारी नहीं करेंगे जिसके बारे में हमें विश्वास न हो कि यह वैश्विक चुनावों को कैसे प्रभावित कर सकती है।”
सोरा वर्तमान में “रेड टीमिंग” प्रक्रिया के अंतर्गत है, जो परीक्षण चरण है जहां लोगों द्वारा कमजोरियों, पूर्वाग्रहों और अन्य हानिकारक मुद्दों की पहचान करने के लिए एआई उपकरण का परीक्षण किया जाता है। मॉडल की सीमाओं से जुड़े सवालों के जवाब में मुराती ने कहा कि कंपनी अपने प्लेटफॉर्म पर निरंतरता बनाए रखना चाहती है. उन्होंने कहा कि कंपनी के छवि जनरेटर मॉडल DALL-E की तरह, सोरा की भी संभवतः “समान नीति” होगी जैसे कि सार्वजनिक हस्तियों की छवियां बनाने पर प्रतिबंध।
मुराती ने पुष्टि की कि “सार्वजनिक रूप से उपलब्ध” वीडियो और शटरशॉक के लाइसेंस प्राप्त वीडियो का उपयोग वीडियो जेनरेशन मॉडल के प्रशिक्षण डेटा के हिस्से के रूप में किया गया था। हालाँकि, जब पूछा गया कि क्या YouTube, Facebook और Instagram के वीडियो का उपयोग प्रशिक्षण में किया गया था, तो मुराती ने कहा कि यदि वे उपयोग के लिए सार्वजनिक रूप से उपलब्ध होते, तो हो सकते थे, लेकिन वह निश्चित रूप से नहीं कह सकतीं।