هوش مصنوعی Midjourney چیست و چگونه با آن کار کنیم؟
اقتصاد ۱۰۰ - هوش مصنوعی Midjourney یکی از ابزارهای رایگان برای تبدیل متن به عکس است که در دسترس عموم قرار دارد. در مطلب پیشرو به آموزش کار با Midjourney و ارائه توضیحاتی پیرامون امکانات و قابلیتهای آن خواهیم پرداخت.

به گزارش گروع دانش و فناوری به نقل از دیجیاتو، ساخت آثار هنری با استفاده از هوشهای مصنوعی و تبدیل متن به عکس با ابزارهای خودکار، یکی از داغترین جنبههای فناوری در ماههای اخیر بوده است. هوش مصنوعی Dall-E شرکت OpenAI یکی از بهترین نمونههای چنین ابزارهایی است که خروجی آن از دقت بالایی بهره میبرد. با این حال محصول گفته شده به شکل رایگان در اختیار علاقهمندان قرار ندارد و معمولاً کاربران برای شروع کار به سراغ گزینههای دیگری مثل هوش مصنوعی Midjourney یا Craiyon میروند.
کار با ابزار Craiyon نسبت به سایر گزینههای موجود بسیار آسانتر است؛ زیرا با مراجعه به سایت آن میتوان حتی بدون ساخت حساب کاربری، اقدام به تبدیل متن به عکس کرد. اما خروجیهای هوش مصنوعی مذکور، دقت چندان بالایی ندارد و همین مسئله موجب شده است تا کاربران بیشتری به سوی Midjourney سوق پیدا کنند. جالب است بدانید که تصویر ساخته شده با هوش مصنوعی مذکور توانست در یک جشنواره هنری مقام اول را به خود اختصاص دهد.
شایان ذکر است که برخلاف اغلب پلتفرمهای فعلی، کاربران هنگام استفاده از Midjourney میتوانند از چهره افراد مشهور هم خروجی تهیه کنند. اغلب تصاویر ساخته شده توسط آن، استایل هنری خاصی دارد و چندان واقعگرایانه به نظر نمیرسند؛ اما با وارد کردن جزئیات دقیقتر، امکان کنترل بیشتر روی استایل تصاویر وجود خواهد داشت. توجه داشته باشید که تنها ۲۵ تصویر اول ساخته شده با این هوش مصنوعی رایگان خواهد بود و برای ادامه کار باید ۱۰ دلار در ماه به ازای ۲۰۰ فایل پرداخت کنید.
آموزش کار با هوش مصنوعی Midjourney
هوش مصنوعی Midjourney بر بستر پلتفرم دیسکورد فعالیت دارد و نرمافزار یا وب سایت جداگانهای برای بهرهمندی از قابلیتهای آن در نظر گرفته نشده است. دلیل این امر، تاکید سازندگان پروژه به اجتماعی محور بودن آن است؛ به طوری که کاربران میتوانند تصاویر ساخته شده توسط دیگر افراد را مشاهده کنند و از توضیحات آنها برای ساخت خروجیهای دیگر الهام بگیرند.
- برای شروع کار با مراجعه به وب سایت Discord.com یک حساب کاربری رایگان برای خود ایجاد کنید و وارد آن شوید. دیسکورد در قالب نسخه تحت وب و اپلیکیشن دسکتاپ یا موبایل در دسترس قرار دارد.
- وارد وب سایت Midjourney.com شوید و روی گزینه Join the beta کلیک کنید. با زدن گزینه گفته شده، به صورت خودکار یک دعوتنامه در دیسکورد برای شما ارسال میشود.
- درخواست دعوت دریافتی در دیسکورد را با زدن گزینه Accept Invite در اپلیکیشن یا نسخه تحت وب، قبول کنید و سپس گزینه Continue to Discord را انتخاب نمایید.
- بعد از باز شدن اپلیکیشن دیسکورد به شکل خودکار، روی آیکن Midjourney (قایق سفید) از پنل سمت چپ کلیک نمایید.
- در داخل کانالهای Midjourney به دنبال عنوان Newcommer Rooms بگردید و سپس یکی از آنها را (مثلاnewbies 101) را انتخاب کنید.
- اکنون قادر خواهید بود از قابلیت تبدیل متن به عکس این ابزار استفاده کنید؛ اما همانطور که در قبل اشاره شد، توجه داشته باشید که تنها ۲۵ تصویر رایگان در اختیار شما قرار میگیرد.
- در داخل چت باکس اتاق انتخاب شده، عبارت imagine/ را تایپ کنید. پس از وارد کردن این دستور، قادر خواهید بود توضیحات مورد نظر را که قصد تبدیل کردن آنها به تصویر را دارید، وارد نمایید. هرچه جزئیات بیشتری در اختیار هوش مصنوعی قرار دهید، نتیجه مطلوبتری هم دریافت خواهید کرد.
- پس از اتمام نوشتن توضیحات، کلید Enter را بزنید تا پیام ارسال شود.
- کمی صبر کنید تا فرایند ساخت تصاویر براساس توضیحات وارد شده، به اتمام برسد. پس از اتمام آن، چندین حالت مختلف از تصاویر ایجاد شده توسط هوش مصنوعی برای شما در قسمت گفتگو ارسال میشود.
- در پایین تصاویر چندین کلید با عناوین U و V به همراه اعداد مشاهده میشوند. این کلیدها به ترتیب برای بزرگتر کردن یک تصویر یا ساخت یک تصویر جدید براساس مورد انتخاب شده، کاربرد دارند.
- برای مثال اگر کلید U2 را بزنید، تصویر دوم بزرگتر خواهد شد و اگر کلید V4 را بزنید، تصاویر جدیدی براساس تصویر چهارم ایجاد میشوند.
- همچنین یک کلید دیگر برای رفرش کردن نتیجه در پایین تصاویر به چشم میخورد که با کلیک روی آن میتوانید نتایج جدیدی را دریافت کنید. توجه داشته باشید هربار استفاده از کلید رفرش یا V یک واحد از اعتبار رایگان شما کم خواهد کرد.
- اگر روی کلید U کلیک کنید، چندین گزینه متفاوت مشاهده خواهید کرد که هرکدام، عملکرد متفاوتی خواهند داشت. برای مثال گزینه Upscale to Max موجب بزرگتر شدن تصویر تا بیشترین حد ممکن (1664 در 1664 پیکسل) میشود و گزینه Light Upscale Redo هم تصویر را با جزئیات کمتری بزرگ میکند.
- پس از اتمام کار، میتوانید تصویر خروجی را با زدن ایموجی پاکت نامه (✉️) برای خود ارسال کنید. سپس میتوانید آن را ذخیره یا دانلود نمایید. تصاویری که بزرگ شده باشند، در داخل گالری وب سایت Midjourney هم قابل مشاهده خواهند بود.
دستورات کاربردی در Midjourney
هنگام استفاده از هوش مصنوعی Midjourney میتوانید از دستورات و پارامترهایی برای بهبود خروجی، بهره بگیرید. در پایین به برخی از مهمترین دستورات و عملکرد آنها اشاره شده است.
- imagine/ مهمترین دستور در Midjourney است که پس از آن، توضیحات مربوطه برای ساخت تصویر نوشته میشود.
- help/ برای نمایش اطلاعات و نکات کاربردی درباره بات Midjourney کاربرد دارد.
- info/ برای نمایش پروفایل، طرح کاربری، اعتبار باقیمانده و... استفاده میشود.
- subscribe/ یک لینک اختصاصی برای حساب کاربری دیسکورد فعلی شما ایجاد میکند و نیاز به ورود جداگانه از طریق وب سایت را از بین میبرد.
- relax/ اگر حساب کاربری پولی داشته باشید، با فعال کردن این حالت میتوانید بدون کم شدن از اعتبار، خروجی دریافت کنید؛ اما زمان مورد نیاز برای ساختن تصاویر طولانیتر خواهد شد.
- private/ در این حالت، تنها شما میتوانید خروجی تصاویر خود را مشاهده کنید؛ اما بهرهمندی از آن ماهانه ۲۰ دلار هزینه در پی خواهد داشت.
همانطور که در قبل اشاره شد، توضیحات مورد نظر پس از دستور /imagine وارد میشود. همچنین با تعیین کردن پارامترهایی، میتوان نتیجه دقیقتری را دریافت نمود. در پایین تعدادی از پارامترهای مرتبط با دستور مذکور، توضیح داده شدهاند.
- beta-- پارامتری برای استفاده از یک الگوریتم آزمایشی جدید است. این الگوریتم به زمان بیشتری برای ارائه خروجی نیاز خواهد داشت و تنها ۲ تصویر ایجاد خواهد کرد. همچنین برخی دیگر از پارامترها به صورت همزمان با آن قابل استفاده نخواهند بود.
- hd-- برای استفاده از یک الگوریتم متفاوت و قدیمیتر کاربرد است که گزینه بهتری برای تصاویر بزرگ با موضوعات انتزاعی یا منظره به شمار میرود. این الگوریتم به صورت خودکار تصاویری با رزولوشن بالاتر بدون نیاز به Upscale ایجاد میکند.
- aspect-- یا ar-- برای ایجاد خروجی با نسبت تصویر مشخص بکار میرود. برای مثال –ar 16:9 اقدام به ارائه تصویری با نسبت ۱۶ به ۹ میکند.
- w-- و h-- برای تعیین رزولوشن دقیق خروجی مورد استفاده قرار میگیرد. برای مثال --w 256 موجب میشود تا عرض تصویر برابر با ۲۵۶ پیکسل باشد. مقادیر وارد شده هم باید در بازه ۲۵۶ الی ۲۰۳۴ پیکسل قرار بگیرد.
- stylize-- یا s- برای تعیین مقدار هنری بودن خروجی کاربرد دارد. پس از آن باید مقدار عددی مورد نظر که بین بازه ۶۲۵ الی ۶۰۰۰۰ است، ذکر شود. کمترین مقدار ممکن است s-- 625 است و هرچه مقدار وارد شده کمتر باشد، خروجی نزدیکتری به توضیحات کاربر ارائه میکند.
- quality-- یا q-- برای تنظیم سرعت ساخت تصاویر استفاده میشود و مقدار آن بین 0.25 تا 5 است. بیشترین سرعت با --q 0.25 و کمترین سرعت با --q 5 تنظیم میشود.
انتهای پیام