گوگل محتوای انبوه ماشینی تولید شده به قصد SEO و به وسیله هوش مصنوعی را دوست ندارد، اما واقعیت دقیقا چیست؟
به گزارش وبلاگ تالار پذیرایی، بازاریابان محتوا و کارشناسان SEO در مورد اظهارات جان مولر از گوگل در مورد محتوای تولید شده از طریق هوش مصنوعی و اینکه از اصطلاح هرزنامه در مورد آنها استفاده کرده، سر و صدا به پا کرده اند. او این کار را در حین پاسخ دادن به یک سوال در خلال همایشی در مرکزی جستجوی گوگل در اول آوریل انجام داد (البته محتوای این همایش هیچ ربطی به این تاریخ خاص نداشت).
پاسخ مولر تکان دهنده نیستt به خصوص با توجه به اینکه گوگل در سال های اخیر بار ها به این سوال پاسخ داده. علاوه بر این، محتوای تولید شده به اتوماتیک، طبق دستورالعمل های وبمستری، چیزی است که باید از آن پرهیز کرد.
با این حال، محتوای تولید شده از طریق هوش مصنوعی موضوعی محبوب برای بحث در رسانه های اجتماعی، انجمن ها و فوروم های تخصصی است. به خصوص در سال های اخیر که این فناوری پیشرفت کرده.
سوال این بود: واکنش گوگل به وب سایت هایی که محتوای نوشته شده با هوش مصنوعی را منتشر می کنند، چگونه است؟ آیا گوگل می تواند تفاوت بین محتوای نوشته شده از طریق هوش مصنوعی یا انسان را تشخیص دهد؟
مولر البته از اظهار نظر بیان قطعی خودداری کرد، اما گفت که در نهایت فرقی نمی کند که محتوا از طریق انسان نوشته شده باشد یا ربات. گوگل در هر صورت، می تواند تشخیص دهد که آیا محتوای تولید شده، کیفیت بالا دارد یا بی کیفیت یا هرزنامه است. ضمن اینکه در بعضی موارد، به احتمال زیاد نتایج صفحه یک گوگل با محتوای تولید شده از طریق روبات ها پر می گردد.
به صورت خنده داری مثلا در صفحه اول گوگل در مورد موضوع همین مقاله جستجو کنید، به مقاله ای برمی خورید که در رتبه دو است و به صورت چالشی ، عنوان مقاله این است:
آیا می توانید بگویید که این مطلب را یک انسان نوشته یا ماشین؟!
گوگل در مورد محتوای تولید شده به طور اتوماتیک می گوید:
محتوای تولید شده اتوماتیک، محتوایی است که به صورت برنامه ریزی شده تولید شده. در مواردی که هدف آن دستکاری رتبه بندی جستجو و عدم کمک به کاربران باشد، ممکن است گوگل اقداماتی را در مورد چنین محتوایی انجام دهد. بعضی از موارد (و نه همه آنها) در اینجا فهرست شده اند:
- متنی که برای خواننده انسانی معنی ندارد اما ممکن است حاوی کلمات کلیدی جستجو باشد.
- متن ترجمه شده از طریق یک ابزار اتوماتیک بدون بازبینی یا نظارت انسانی قبل از انتشار.
- متن تولید شده از طریق فرآیند های اتوماتیک، مانند زنجیره مارکوف.
- متن تولید شده با استفاده از تکنیک های مترادف سازی یک متن از قبل موجود یا مبهم سازی اتوماتیک.
- متن تولید شده از بازنشر فید های Atom/RSS یا نتایج جستجو
-ترکیب محتوا از صفحات مختلف وب بدون افزودن ارزش کافی به آن
آیا این گایدلاین جدی است؟
از نقطه نظر عملی نمی گردد گفت که این موارد کاملا از طریق گوگل رعایت می شوند. جالب است که قسمت قابل توجهی از محتوای تولیدشده از طریق کاربران از همین تکنیک ها استفاده می کند.
شاید در وب فارسی این مطلب بیشتر به چشم بخورد. مثال عرض می کنم:
1- مثلا وقتی که نام یک فیلم را جستجو می کنید، به جای اینکه سایت هایی که مقاله ای در مورد فیلم نوشته اند، اندکس شوند، بیش از 90 درصد نتایج جستجو، سایت های دانلود را به شما نشان می دهد. کسی که در پی خواندن مقاله نقد و تحیل و معرفی است، پس مجبور می گردد که عباراتی مانند نقد و تحلیل و خلاصه داستان را اضافه کند.
البته در همینجا هم اگر سایتی یک مقاله مشروح باکیفیت در مورد فیلمی نوشته شده باشد، باز هم بخت رتبه بندی خوب آن وجود دارد. اما جالب است که گوگل دست کم به زبان فارسی، گرایش اندکس سایت های دانلود را دارد. البته محتمل است که سایت های دانلود از تکنیک های SEO خوب یا روش هایی مانند لینک گیری زیاد استفاده می کنند و سرمایه گذاری زیادی برای این کار میکنند
2- نتایج غیرمرتبط هم غوغا می کنند. مثلا شما جستجو می کنید تا کتابی دانلود کنید. خوشبختانه این سال ها خیلی موارد گوگل ترجیح می دهد صفحه خرید و دانلود کتاب را در سایت هایی قانونی مانند فیدیبو و طاقچه را برایتان در رتبه بالا نمایش بدهد. اما هنوز هم سایت هایی هستند که تیتر کاذب دانلود فلان کتاب را دارند و در متن اصلی و قسمت دانلود، هیچ چیز مرتبطی مشاهده نمی گردد.
3-گوگل مطلب طولانی را دوست دارد. اما آیا همیشه مطلب طولانی کیفیت خوبی دارد؟!
یکی از بحران های اندکس مطالب به زبان فارسی در قسمت پزشکی مشاهده می گردد. سایت هایی هستند که با تکنیک های SEO مانند آماده کردن مقاله خیلی طولانی و عنوان های میان متنی، گوی سبقت را از مقاله مختصر ؛ اما مفید و معتبر می ربایند.
4- فعلا البته ربات خیلی هوشمند به فارسی برای مترادف کردن و ترکیب مقالات از قبل موجود نداریم، اما محتواساز و حق نشر های انسانی بسیار زیادی در این حیطه فعالیت می کنند.
5- یک تبصره که همینجا باید اشاره کنم که ترکیب مقالات در صورت داشتن ارزش افزوده هم برای کاربر انسانی ارزشمند است و هم برای گوگل. فرض کنید برای مطلبی کسی با هوشمندی خلاصه 4 مقاله به زبان فارسی و ترجمه 2 مقاله با انگلیسی را با رعایت SEO با هم ترکیب کند. این دیگر در بند تولید اتوماتیک مطلب قرار نمی گیرد و این دست مقالات خیلی خوب اندکس می شوند.
6- گرچه ممکن است مقالات بی ارزش هم خیلی موارد رتبه های بالا را کسب کنند، اما معمولا اگر مقاله ای با کیفیت خوب برای کاربر انسانی تولید شده باشد و دستور العمل های SEO هم در آن خوب رعایت شده باشد، علیرغم همه نقص ها شانس رتبه بندی خوبی دارد.
البته از ان سو ممکن است شما مقاله خیلی خوبی تولید کنید، اما از صفحه 3 به آن سو رتبه بندی گردد! باید قبول کنید که نمی گردد همیشه به هدف زد و عوامل متنوع مثل اعتبار خود سایت و لینک های ارجاعی و نکات ریزی هم هستند که روی رتبه بندی تاثیر می گذارند.
اما از مطلب اصلی دور نشویم. ما نمی خواهیم مسائل تولید محتوا و بازار آن یا SEO را در این مقاله بررسی کنیم. فقط می خواهیم ببینیم که تولید رباتیک مقاله از نظر گوگل چگونه است.
اظهارات قبلی قبلی گوگل در مورد استفاده از هوش مصنوعی برای تولید محتوا
2022: از مولر در مورد ابزار های تولید محتوا با هوش مصنوعی مانند جاسپر سؤال شد و در توییتی پاسخ داد: این ابزارهای تولید محتوا از زمان شروع وب وجود داشته اند. مردم برای انجام این کار از انواع ابزار ها و ترفند ها استفاده کرده اند. تا آنجا که من می توانم بگویم، بیشتر سایت ها در ایجاد محتوای با کیفیت بالا مشکل دارند، آنها در ایجاد محتوای باکیفیت پایین مسئله ای ندارند.
2021: مولر گفت که گوگل احتمالاً بیشتر روی کیفیت محتوا تمرکز خواهد کرد تا نحوه تولید آن. به این معنا که اساساً گوگل ممکن است با رتبه بندی محتوایی که از طریق ماشین نوشته می گردد هم مسئله ای نداشته باشد و ملاک تنها کیفیت مطلب است.
2020: در بحث در مورد عملکرد ضعیف GPT-3 (ترانسفورماتور از پیش آموزش دیده 3 که می تواند متنی شبیه انسان تولید کند و محتوایی را ترجمه کند)، گری الیز Gary Illyes از گوگل گفت که گوگل نمی خواهد محتوای ترجمه شده ماشینی اندکس گردد. او مثال جالبی در توییتر مطرح نمود که ترجمه با کیفیت پایین اتوماتیک در آن درج شده بود.
(اما خب مسلم است که ترجمه ماشینی هم اگر کیفیت خوب داشته باشد، نه قابل تشخیص است و نه گوگل حساسیتی روی آن می تواند داشته باشد.)
2019: از مولر پرسیده شد که آیا ترجمه اتوماتیک محتوا می تواند به اندکس نشدن مطلب گردد. به طور خلاصه، او گفت نه، اما اگر محتوا ضعیف باشد، احتمالاً رتبه خوبی نخواهد داشت.
2017: از ایلیز پرسیده شد که آیا ابزار هایی که با استفاده از داده ها، محتوای قابل خواندن برای انسان تولید می کنند، محتوای تولید شده به صورت اتوماتیک در نظر گرفته می شوند یا خیر. ایلیز پاسخ داد که گوگل به این موضوع فکر می کند اما در آن زمان چیزی برای گفتن نداشت.
2010: مولر گفت که استفاده از ابزار های ترجمه اتوماتیک (مانند مترجم گوگل) برای ایجاد محتوا، در بعضی موارد، می تواند به عنوان ایجاد محتوای تولید شده اتوماتیک، که برخلاف دستورالعمل های وب مستری است، تلقی گردد.
یک موضع کنایه آمیز؟
گوگل خود را اولین شرکت هوش مصنوعی می داند. گوگل از صد ها مدل یادگیری ماشینی در محصولات مختلف خود استفاده مانند موتور جستجو، تبلیغات، یوتیوب، جی میل استفاده می کند.
پس چرا باید در مورد محتوای تولید شده از طریق هوش مصنوعی تامل داشته باشد؟
خب، همه چیز به کیفیت مطلب یا حداقل تفسیر الگوریتم های گوگل از مفهوم کیفیت برمی گردد.
پس ما با چیز متناقضی روبرو نستیم. گوگل در مورد پاداش دادن به محتوای با کیفیت، تا حالا تغییر فرایندی نداشته. به روزرسانی پاندا یکی از تلاش های بزرگ گوگل برای زدودن آشفته بازار کاسب کارهایی بود که با استفاده از نتایج جستجوی گوگل، محتواهای تصنعی برای رتبه گرفتن می ساختند.
خطرات محتوای تولید شده از طریق هوش مصنوعی در مقابل فواید آن
خطر شماره یک: گوگل صفحه/سایت شما را بی ارزش تشخیص بدهد و رتبه کلی مطالب آن پایین بیاید یا مطالب از قبل اندکس شده آن، حذف گردد. بعد از آن باید کلی انرژی صرف کنید تا به جایگاه اولیه برگردید.
خطر دوم: کپی برداری از کار های دیگران هستید که از قبل به صورت آنلاین وجود دارد، همیشه دارای ریسک است.
زیر نظر گرفتن رفتار رقبا یا نتایج جستجو، چیز بدی نیست و یکی از راهبردهای هر سایتی باید این هم باشد. اما مشکل این است که این یک مدل رهبری در وب نیست. منظورم این است که اگر می خواهید سایت پیش رو باشید، باید مطالب یکتای با کیفیت بالا تولید کنید، نه اینکه همیشه به سایتهای دیگر نگاه کنید تا ببینید چه تولید کرده اند و بعد مقالاتی همسو تولید کنید یا با تغییر ظاهری ادبیات مقالات سایتهای رقیب، مطالبی برای رتبه گرفتن تولید کنید.
خطر سوم: کیفیت فرایند اتوماتیک معمولا پایین است
آنچه شما از هوش مصنوعی می گیرید، همیشه نیاز به ویرایش زیاد دارد. ربات های هنوز کنایه ها را درک نمی کنند، گاهی اشتباه مضحک می کنند و اعتبار شما را از بین می برند. شما می توانید فرایندهای اتوماتیک را در بعضی حوزه ها مد نظر داشته باشید، اما در کنارش به نویسنده های و ویرایشگرهای متن خوب هم نیاز خواهید داشت و نمی توانید بدون هزینه کردن برای آنها، از عهده کار برآییید.
سود شماره 1: نوشتن زمان بر است
تولید محتوای درجه یک به زمان خیلی زیادی نیاز دارد. با هوش مصنوعی می تواند این زمان را کاهش داد.
چند سال پیش آسوشیتدپرس به دلیل استفاده از روزنامه نگاران روباتی در خبرها و تحلیل هایی که جنبه آماری سنگین داشتند، توجه زیادی را به خود جلب کرد و توانست 20 درصد در وقت نویسندگان خود صرفه جویی داشته باشد.
سود دوم: محتوای خوب ارزان نیست
به عنوان صاحب یک سایت یا کسی که می خواهد محصولات خود را با تکیه بر رتبه خوب در گوگل بفروشد، شما باید نویسنده هایی و تیمی داشته باشید که سه چیز داشته باشند: 1- خوش قلم باشند و ادبیات خوبی داشته باشند و گرامز کلی را رعایت کنند و مقدمه های عالی بنویسند. 2- تکنیک های SEO را رعایت کنند. 3- در مورد چیزی که می نویسند که متخصص باشند یا دست کم قبلا در آن حوزه زیاد قلم زده باشند.
چنین نویسنده ها یا تیمی، هزینه زیادی هم می خواهد و بسکمک از سایت ها از عهده پرداخت کسری از حق الزحمه چنین تیم تخصصی برنمی آیند.
سود سوم: محتوای تولید شده اتوماتیک یا با هوش مصنوعی برای ایده گرفتن خوب است
بلوک یا وقفه نویسندگی بدترین چیزی است که یک نویسنده و ژورنافهرست آنلاین می تواند با آن روبرو گردد. نویسندگی بیشتر وقت ها ریتمی سینوسی دارد. شما بعضی روزها سرشار از انرژی و ایده هستید و بعضی روزها هر چقدر زور می زنید، هیچ چیز نمی توانید بنویسید.
اما محتوای تولیدشده از طریق هوض مصنوعی می تواند کاتالیزوری برای شما باشد، تلنگری به شما بزند و شما را از برهوت ایده به طوفان فکری هدایت کند!
چرا اصلا اینقدر در این مورد نوشتم؟!
روش های SEO و تولیدمحتوا یک دانش و تجربه و مهارت بسیار گسترده هستند. هیچ پاسخ واحدی باری انواع مسائل و سناریوهای پیش آمده وجود ندارد. شما همیشه باید برآورد کنید که یک کار برای شما سود بیشتری دارد یا زیان بیشتر.
هوش مصنوعی در آینده می تواند به شما کمک بیشتری برای تولید محتوا کند. هوش مصنوعی می تواند زمین مورد نیاز برای احداث یک بنا را برای شما آماده کند. اما بقیه کار و آنچه باعث تمایز و برندینگ شما می گردد، به خلاقیت نیروی انسانی بستگی دارد.
نوشتن برای انسان، هنوز هم باید از طریق انسان ها صورت بگیرد. با فرایندهای اتوماتیک و نوشتن مطالب دم دستی شاید بگردد برای بعضی کلمات کلید رتبه های خوبی گرفت. اصلا شاید بگردد با این کار سایت را به هیت و بازدیدکننده درخشانی رساند. اما در یک گام فراتر، همیشه کاربران از نویسندگان و سایت هایی یاد می کنند که از احساس و نیاز و حال و هوای موضوعی به صورت هوشمندانه می نویسند.
یک سری فرایندهای زمان بر و انرژی گیر به صاطلاح مکانیکی را می گردد به ابزارهای موجود یا آنهایی که بعدا در خدمت ما درخواهند آمد، سپرد، اما بعضی فرایندهای هم دست کم در آینده نزدیک و میان مدت، همچنان از عهده انسان برخواهند آمد.
یاد فیلم بلید رانر 2049 و کاراکتر دکتر آنا استلین می افتم که متخصص یکتای تولید خاطره در مغزهای موجودات شبیه سازی شده بود. این کار خاطره سازی و تولید رؤیا چیزی بود که تنها از عهده او برمی آمد.
منبع
منبع: یک پزشک