سیستمهای هوش مصنوعی مخصوص تبدیل متن به تصویر اکنون هم از نظر توانایی و هم از نظر محبوبیت در حال رشد هستند و تیکتاک قصد دارد تا از آنها به صورتی گسترده در پلتفرم خودش استفاده کند.
این پلتفرم مخصوص به اشتراکگذاری ویدیو به تازگی افکت جدیدی را به نام AI greenscreen در اختیار کاربران خود قرار داده است که به آنها این امکان را میدهد تا پیامهای متنی را تایپ کنند و نرمافزار هم به صورت نسبتا خوبی میتواند آن را به تصویر تبدیل نماید. شما در نهایت امکان استفاده از تصویر به عنوان پسزمینه یک ویدیو را خواهید داشت.
خروجی سیستم تیکتاک در مقایسه با مدلهای پیشرفتهتر تبدیل متن به تصویر، مانند سرویس Imagen شرکت گوگل، Dall-E 2 شرکت OpenAI یا نرمافزار جدید شرکت Midjourney بسیار ابتدایی است. اکنون، این قابلیت تنها میتواند تصاویر انتزاعی و چرخشی را برای شما تولید کند، اما مدلهای دیگر این توانایی را دارند تا هم تصاویر فوتورئالیستی و هم تصاویر پیچیده و منسجمی را تولید کنند که به نظر میرسد توسط انسان طراحی یا نقاشی شدهاند.
البته، میتوان حدس زد که تیکتاک این محدودیتهای گفته شده را به صورتی کاملا عمدی به وجود آورده باشد. از اصلیترین دلایل این موضوع میتوان به قدرت محاسباتی مورد نیاز بیشتر مدلهای پیشرفتهتر اشاره کرد که شرکتها برای ارائه چنین چیزی باید سرمایهگذاری کلانتری را انجام دهند و منابع بیشتری را به آن اختصاص دهند.
دلیل دیگر این موضوع هم میتوان به تعداد کاربران بسیار زیاد پلتفرم تیکتاک نسبت داد. همه این افراد میتوانند از قابلیت جدید تیکتاک برای ایجاد تصاویر واقعی استفاده کنند و این موضوع میتواند نتایج نگرانکنندهای را به همراه داشته باشد. برای مثال، رسانهها سعی کردند که مطالبی مانند عکسهای مستهجن را از این موتور تبدیل متن به تصویر بخواهند، اما درست مانند چیزی که در دیگر موتورها دیده بودیم، چنین مواردی را تولید نکرد.
محدودیتهای نمایش تصاویر به رد درخواست محدود نمیشود و تعدادی از کاربران اعلام کردهاند که به این پلتفرم درخواست تولید تصویر صحنه قتل بوریس جانسون یا جو بایدن را دادهاند، اما در بیشتر موارد با تصاویری مواجه شدهاند که چیزی بیشتر از چرخشهای انتزاعی نیست و در آن میان هم چهره نخست وزیر سابق انگلستان یا رئیس جمهور فعلی آمریکا هم وجود داشت.
پس آنچه که ما میتوانیم در مورد قابلیت AI greenscreen پلتفرم تیکتاک بگوییم، این است که به ما نشان میدهد این شرکت توجه بسیار زیادی را روی قابلیت تبدیل متن به تصویر گذاشته و قصد دارد آن را کمکم توسعه دهد. اولین جرقه شروع استفاده از چنین قابلیتی به سال 2021 و پلتفرم DALL-E باز میگردد که توسط شرکت OpenAI تولید شده بود. حال، کمتر از دو سال از این فناوری میگذرد و ما میتوانیم با استفاده از پلتفرم تیکتاک تصاویر دلخواه خود را تولید کنیم.
با توجه به چیزهایی که ما در گذشته در مورد الگوریتم اعتیادآورد تیکتاک دیده بودیم، احتمالا همه چیز از این مرحله به بعد وارد فاز کاملا جدیدی خواهد شد. احتمالا بسیاری از فعالین حقوق بشر به این موضوع ورود پیدا خواهند کرد و تیکتاک را با چالشهایی مواجه میکنند.