برای بهینه سازی برای پردازش زبان طبیعی از برگه آزمایشی کاغذ استفاده کنید

برای بهینه سازی برای پردازش زبان طبیعی از برگه آزمایشی کاغذ استفاده کنید

dmin آموزش سئو


اگر یک کاغذ خالی به کسی تحویل داده اید و تنها چیزی که روی آن نوشته شده است عنوان صفحه است ، آیا آنها می فهمیدند این عنوان چیست؟ آیا آنها تصوری واضح از اینكه سند واقعی در مورد چیست می توانند داشته باشند؟ اگر چنین است ، پس تبریک می گویم! شما فقط برگه کاغذ خالی را برای عناوین صفحه منتقل کرده اید زیرا عنوان شما توصیفی است.

برگه آزمایشی کاغذ (BSoPT) ایده ای است که ایان لوری در طی سالها و در این اواخر در وب سایت جدید خود درباره بسیاری صحبت کرده است. این یک آزمایش است که ببیند آنچه شما نوشتید برای کسی که قبلاً با مارک یا محتوای شما روبرو نشده است ، معنی دارد یا خیر. به قول یان ، “آیا این متن که روی کاغذ خالی نوشته شده است ، برای یک غریبه معنی دارد؟” برگه آزمایشی کاغذ در مورد وضوح و بدون زمینه است.

اما اگر BSoPT را به جای یک شخص در دستگاه انجام دهیم چه می شود؟ آیا آزمایش فکر ما هنوز کاربرد دارد؟ من هم اینچنین فکر میکنم. ماشین آلات نمی توانند بخوانند – حتی پیشرفته هایی مانند Google و Bing. آنها فقط می توانند در معنای محتوای ما حدس بزنند ، که این تست را به خصوص مرتبط می کند.

من یک نسخه جایگزین از BSoPT دارم ، اما برای دستگاه ها: اگر همه دستگاه ها بتوانند لیستی از کلماتی را که در یک سند مشاهده می شوند و چند بار مشاهده می کنند ، می توانند منطقی بدانند که سند درباره چیست؟

برگه آزمایشی کاغذ برای فرکانس کلمه

اگر شما یک کاغذ خالی را به کسی تحویل داده اید و تنها چیزی که روی آن نوشته شده است این جدول از کلمات و فرکانس ها است ، آیا می توانند حدس بزنند که مقاله چیست؟

عکس برای بهینه سازی برای پردازش زبان طبیعی از برگه آزمایشی کاغذ استفاده کنید

مقاله ای در مورد تیز کردن چاقو حدس خوبی است. مقاله ای که من از این جدول فرکانس کلمه استفاده کردم راهنمای چگونگی تیز کردن چاقوی آشپزخانه بود.

اگر کلمات “پله” و “چگونه” در جدول ظاهر شود چه می شود؟ آیا شخصی که در حال خواندن است اطمینان بیشتری به این مقاله در مورد تیز کردن چاقو یا کمتر دارد؟ آیا آنها می توانند بگویند که آیا این مقاله در مورد تیز کردن چاقوهای آشپزخانه یا چاقوهای جیب است؟

اگر نتوانیم ایده خوبی از آنچه در رابطه با مقاله است که بر اساس کلماتی که استفاده می کند بدست آوریم ، آنگاه BSoPT را برای فرکانس کلمه خراب نمی کند.

آیا ما هنوز می توان از فرکانس کلمه برای BERT استفاده کرد؟

رویکردهای اولیه پردازش زبان طبیعی (NLP) که توسط موتورهای جستجو به کار رفته است ، از آنالیز آماری فرکانس کلمه و وقایع همزمان کلمه استفاده می کند تا یک صفحه را مشخص کند. آنها نظم و بخشی از گفتار کلمات موجود در محتوای ما را نادیده گرفتند ، و اساساً صفحات ما را مانند کیسه های کلمات رفتار می کردند.

ابزاری که برای بهینه سازی آن نوع NLP استفاده کردیم ، کلمه فرکانس مطالب خود را در برابر رقبای خود مقایسه کرد و به ما گفت که شکاف در استفاده از کلمات در کجاست. به صورت فرضی ، اگر آن کلمات را به محتوای خود اضافه کنیم ، رتبه بالاتری می گرفتیم ، یا حداقل به موتورهای جستجوگر کمک می کنیم تا محتوای ما را بهتر درک کنند.

این ابزارها هنوز وجود دارند: Market Muse ، SEMRush ، seobility ، Ryte و دیگران نوعی فرکانس کلمه یا قابلیت تجزیه و تحلیل شکاف TD-IDF را دارند. من از یک ابزار فرکانس کلمه رایگان به نام Online Text Compparator استفاده کرده ام ، و بسیار خوب کار می کند. آیا آنها هنوز مفید هستند که موتورهای جستجو با رویکردهای NLP مانند BERT پیشرفت کرده اند؟ من فکر می کنم که چنین است ، اما به آسانی به معنای کلمات بیشتر = رتبه بندی بهتر نیست.

BERT بسیار پیچیده تر از رویکرد کلمات است. BERT به ترتیب کلمات ، بخشی از گفتار و هر موجودیتی که در محتوای ما وجود دارد نگاه می کند. این بسیار قوی است و می تواند برای انجام بسیاری از کارها از جمله پاسخ دادن به سؤال و شناخت موجودیت ، آموزش ببیند – قطعاً پیشرفته تر از فرکانس اصلی کلمه.

با این حال ، BERT هنوز هم برای عملکرد باید به کلمات موجود در صفحه نگاه کند و فرکانس کلمه خلاصه اصلی آن است. اکنون ، موقعیت مکانی کلمات و بخشی از گفتار اهمیت بیشتری دارند. ما فقط نمی توانیم کلماتی را که در تحلیل شکاف خود پیدا کردیم در اطراف صفحه بپاشیم.

افزایش محتوا با ابزار فرکانس کلمه

برای کمک به اینکه محتوای ما برای دستگاه ها مبهم باشد ، باید آن را برای کاربران مشخص و واضح جلوه دهیم. کاهش ابهام در نوشتار ما در مورد انتخاب کلماتی است که مخصوص موضوع مورد بحث ما هستند. اگر در نوشتار ما از افعال عمومی ، ضمایر و صفتهای غیر موضوعی استفاده می شود ، نه تنها محتوای محتوای ما بلکه درک آن دشوار است.

این نمونه شدید زبان غیر اختصاصی را در نظر بگیرید:

“ترفند یافتن چاقوی آشپز مناسب ، پیدا کردن تعادل مناسب از ویژگی ها ، کیفیت ها و قیمت است. باید از فلز به اندازه کافی قوی ساخته شود که لبه آن را برای مدت زمان مناسبی حفظ کند. باید یک دسته راحت داشته باشید که شما را خسته نکند. لازم نیست هزینه‌های زیادی هم خرج کنید. آشپز خانگی نیازی به چاقوی ژاپنی ۳۵۰ دلار ندارد. “

این نسخه عالی نیست. به نظر می رسد تقریباً ماشین تولید شده است. من نمی توانم تصور كنم كه مقاله كامل نوشته شده مانند این ، BSoPT را برای فرکانس كلمه منتقل كند.

آنچه در جدول فرکانس کلمه به نظر می رسد با حذف برخی از کلمات متوقف شده است:

عکس برای بهینه سازی برای پردازش زبان طبیعی از برگه آزمایشی کاغذ استفاده کنید

حال فرض کنید ما از چند ابزار فرکانس کلمه در چند صفحه استفاده کردیم که به خوبی رتبه بندی می کنند “نحوه انتخاب چاقوی آشپز” و فهمیدیم که این بخش از گفتار معمولاً استفاده می شود:

موجودیت ها: تیغه ، فولاد ، خستگی ، فولاد دمشق ، سانتوکو ، شون (مارک)
افعال
: گرفتن ، خرد کردن
صفت
: کامل ، سخت ، کربن بالا

درج این کلمات در کپی ما متنی را ارائه می دهد که بسیار بهتر است:

“ترفند پیدا کردن چاقوی آشپز مناسب ، گرفتن تعادل مناسب از ویژگی ها ، کیفیت ها و قیمت است. تیغه باید از استیل به اندازه کافی سخت ساخته شود تا پس از استفاده مکرر لبه تیز خود را حفظ کند. شما باید یک دسته ارگونومیک داشته باشید که بتوانید آن را به راحتی بکشید تا از خستگی از تمدید جلوگیری شود. لازم نیست هزین زیادی هم خرج کنید. به این آشپز خانگی نیازی به یک سانتوکوک فولادی دیماکسید با کربن بالا با ارزش ۳۵۰ دلار از شون نیازی نیست. “

این متن به روزرسانی برای طبقه بندی ماشین ها آسان تر خواهد بود و خواندن کاربران نیز بهتر خواهد بود. همچنین استفاده از کلمات مرتبط با موضوع شما فقط نوشتن است.

به دنبال آینده NLP باشید

آیا بهبود محتوای ما با برگه خالی از کاغذ تست برای BERT یا سایر الگوریتم های NLP بهینه شده است؟ نه ، من فکر نمی کنم من فکر نمی کنم مجموعه خاصی از کلمات وجود داشته باشد که می توانیم به محتوای خود اضافه کنیم تا با استفاده از BERT رتبه جادویی بیشتری پیدا کنیم. من این را راهی می دانم که اطمینان حاصل شود که مطالب ما توسط کاربران و دستگاهها به وضوح قابل درک است.

پیش بینی می کنم تقریباً به جایی نزدیک نشویم که ایده بهینه سازی NLP پوچ تلقی شود. شاید طی ۱۰ سال نوشتن برای کاربران و نوشتن برای دستگاه ها به همین دلیل باشد که به دلیل پیشرفت فناوری تا چه حد است. اما حتی پس از آن ، ما هنوز باید اطمینان حاصل کنیم که محتوای ما معنی دارد. و برگه کاغذ خالی از کاغذ هنوز هم مکان خوبی برای شروع خواهد بود.



منبع

شاید دوست داشته باشید:

پشت صحنه در MozCon Virtual

پشت صحنه در MozCon Virtual

تصور مجدد MozCon آسان نبوده است. من دروغ نخواهم گفت – دلم برای دیدن بسیاری از شما به شخصه تنگ […]

نحوه انتخاب منبع داده با ارزش ترین لینک برای محتوای شما

نحوه انتخاب منبع داده با ارزش ترین لینک برای محتوای شما

شرکت Fractl هزاران کمپین بازاریابی محتوا را در هر مبحث ایجاد کرده است و ما برای هفت سال گذشته ، […]

برگه تقلب جستجوی محلی SEO را جستجو کنید!

برگه تقلب جستجوی محلی SEO را جستجو کنید!

چه آزار و اذیت آژانس جستجوگرها خود را هر روز از بین می برد! در بهترین روزهای خود ، نگه […]

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *