احتمالاً شما هم اولین قدمهایتان در ورود به دنیای اینترنت با جستجو در «گوگل» رقم خورده است! مسلماً سادهترین شیوه رسیدن به اطلاعات مورد نظر در این اقیانوس بیکران دادهها، سرچ در گوگل است. اما چقدر با دستورات و اپراتورهای سرچ برای جستجوی پیشرفته و حرفه ای در گوگل آشنا هستید؟
سرچ در گوگل علی رغم ابتدایی و ساده بودن، یکی از مهمترین اصول اوسینت (OSINT) هم هست! یعنی در ضمن عملیات اوسینت – چه بخواهید، چه نخواهید – باید از مسیر گوگل عبور کنید؛ که آوردهاند «گذر پوست لاجَرَم به دباغخانه اوفتَد»! اما در این گذر، یقیناً برای شما هم اتفاق افتاده است که نتوانستهاید آنچه را در ذهن دارید به گوگل بفهمانید. اینجاست که کوئریها (Query)، اپراتورهای جستجو و عملگرهای سرچ پیشرفته متولد میشوند و «سریع یافتن» و «دُرُست یافتن» را تبدیل به یک هنر و مهارت میکند. لذا موضوعی که در این مقاله به طور کامل و مفص به آن میپردازیم نه نشان دادن نحوهی نوشتن دستورات عجیب و غریب در گوگل، که آموزش کاربرد اوسینتی تک تک این دستورات به همراه مثالهایی واقعی برای کسب مهارت جستجوی حرفه ای در گوگل است.
آموزش تکنیک های سرچ حرفه ای در گوگل
۱. دستور نقل قول (” “) : برای جستجوی عین یک عبارت
فرض کنید به دلیلی در گوگل به دنبال یک موضوع خیلی خیلی خاص هستید و میخواهید دقیقاً عین یک عبارت را جستجو کنید. مثلاً سوالات زیر: نام سوژه مورد بررسی در چه سایتهایی آمده؟ چه کسانی هم نام سوژه مد نظر در اینترنت حضور دارند؟ چه سایتهایی یک خبر خاص را از روی هم کپی میکنند؟ و …
برای این دسته سوالات یک عبارت خاص مورد جستجو است و باقی یافتهها ارزشی برای ما ندارند. لذا باید به طریقی نتایج را محدود کنیم. فرض کنید نام سوژه مورد بررسی «سیدافشین میرفندرسکی» باشد. با جستجو عادی در گوگل، نزدیک به ۲۷۰۰۰ نتیجه نمایش داده میشود. اما این نتایج مربوط به اجزای ترکیب مورد جستجوست و هیچ یک مربوط به عین عبارت «سیدافشین میرفندرسکی» نیست. لذا برای محدود کردن جستجو، کافیست عبارت «سیدافشین میرفندرسکی» را میان دو علامت نقل قول (” “) (در ویندوز «گ + Shift») قرار دهیم. تفاوت را ببینید:
مقایسهی جستجوی میرفیندرسکی با دستور و بدون آن.
مثال بعدی موضوع را بهتر روشن میکند. فرض کنید قصد یافتن سایتهایی را دارید که اخبار اقتصادی را از روی هم کپی میکنند. چه میکنید؟ ساده است! کافیست قسمتی از متن خبر را انتخاب کتید و به دنبال عین آن عبارت در جاهای دیگر وب باشید. برای مثال خبر سایت روزنامه «دنیای اقتصاد» با تیتر «دو دنیای متفاوت اقتصاد ایران» را به عنوان صورت مسئله در نظر میگیریم. یک جمله دلخواه از متن خبر را انتخاب میکنیم (مثلاً: «چالشهایی که عمر برخی از آنها به نیم قرن میرسد و ریشهای عمیق در زمین اقتصاد ایران پیدا کردهاند») و با قرار دادن آن میان علامت کوتیشن (” “)، از گوگل میخواهیم هر جای دیگری از وب که عین این عبارت آمده است، نمایش بدهد. نتایج را در دو حالت با “” و بدون “” مقایسه کنید:
حالا از میان ۴ نتیجه حاصل شده از جستجوی عبارت در میان “”، آنکه تاریخ قدیمیتری دارد انتشاردهنده اولیه و منبع اصلیاست. به همین سادگی!
۲. علامت منها ( – ): برای حذف برخی عبارات از نتیجه نهایی
کاربرد اپراتور مهنا ( – ) دقیقاً مثل «تعویض روغنی برادران فرامرزی به جز احسان» است! یعنی از میان یک مجموعه نتیجه جستجو، بخشی که مورد نظر ما نیست حذف گردد. این کار منجر به محدودتر و دقیقتر شدن جستجو میگردد.
برای مثال فرض کنید میخواهیم تظاهرات «جلیقه زردها» در جاهایی به جز فرانسه رصد کنیم. کافیست عبارتهایی که حدس میزنیم در خبرهای مربوط به کشور فرانسه آمده باشد را با استفاده علامت منها ( – ) حذف کنیم تا این نتایج نمایش داده نشوند. بدین صورت که پس از عبارت «جلیقه زردها»، کلمات «فرانسه»، «پاریس» و «مکرون» همراه با – تایپ میکنیم
اعتراضات فرانسه در پاریس و در خارج از آن
در واقع اپراتور منها، نتایجی را نمایش میدهد که در هیچ قسمت از آن صفحه، عبارت منها شده نیامده باشد. یک مثال دیگر: فرض کنید بخواهیم از میان نتایج حاصل از جستجوی «آذری جهرمی»، لینکهای مربوط به سایتهای با دامنه .com را حذف کنیم. برای این منظور پس از «آذری جهرمی» از عبارت -site:.com استفاده میکنیم. نتیجه را مقایسه کنید:
محدود کردن جستجو با توجه به دامنهی سایت
همانطور که ملاحظه میکنید، تعداد نتایج کمترشده، و سایتهای .com (مثل توئیتر یا بیبیسی) از نتایج حذف شدهاند.
۳. علامت ستاره ( * ): برای جستجوی کلمات با فاصله چند کلمهای از هم
علامت ستاره برای زمانی مناسب است که تنها یک کلیتی از عبارت مورد جستجو را بدانید و عین آن برای شما مشخص نباشد. لذا با قرار دادن * در میان عبارت، به گوگل اجازه میدهید ضمن حفظ سایر کلمات، به جای ستاره کلمه دیگری را قرار دهد.
مثلاً: دنبال فردی با فامیلی «میرفندرسکی» میگردیم. از نام کوچک وی اطلاعی نداریم اما میدانیم «سید» است. لذا در نوار جستجوی گوگل مینویسیم: «سید * میرفندرسکی» بدین ترتیب گوگل تمام صفحاتی که در آنها میان «سید» و «میرفندرسکی» اسمی آمده باشد نمایش میدهد. باید توجه داشت که مزیت علامت ستاره آن است که صرفا نتایجی را نشان میدهد که چند کلمه میان عبارت فاصله باشد. کافیست نتایج را با حالت عادی مقایسه کنید تا تفاوت را دریابید:
جستجوی میر فیندرسکی با و بدون محدودیت
نکته: اپراتور AROUND نیز کاربری مشابهی با * دارد.
۴. اپراتور AND: برای جستجوی نتایج حاوی همه دو یا چند عبارت مورد جستجو
این اپراتور نتایجی را نشان میدهد که هر دو عبارت قبل و بعد از AND را دارا باشند.
جستجوی روحانی و جهرمی با «و» و بدون «و»
مقایسه تعداد نتایج حاصل از جستجو کلمات «روحانی» و «جهرمی» به صورت عادی و یا با AND تا حدودی فایده این اپراتور را مشخص میکند. البته با توجه به اینکه گوگل به طور پیشفرض این دستور را در جستجوی عادی اعمال میکند، استفاده از آن تفاوت چندانی ایجاد نمیکند اما هنگامی که با سایر اپراتورها چاشنی شود، بسیار مفید خواهد بود. نکته: در تایپ اپراتور AND، حتما از حروف بزرگ انگلیسی استفاده کنید. علاوه بر این، به جای عبارت AND میتوان از علامت & (در ویندوز Shift + 5) استفاده کرد.
۵. اپراتور OR: برای جستجوی موازی چند عبارت
گوگل به طور عادی میان عبارات مورد جستجو از AND منطقی استفاده میکند. یعنی سعی میکند تا حد امکان تمام عبارت در صفحات نتایج موجود باشد. اما میتوان از طریق قرار دادن OR میان کلمات عبارت مورد جستجو، رابطه «یا» میان وجود آنها در نتایج ایجاد کرد. برای مثال میخواهیم تظاهرات یا اعتصابات مربوط به فرانسه را بررسی کنیم:
جستجوی تظاهرات یا اعتراضات در فرانسه
همانطور که مشاهده میکنید نتایج حاصل از طریق اپراتور OR، مربوط به تمام صفحات دارای خبر پیرامون «اعتصابها» یا «تظاهرات» و یا هر دو اینها در فرانسه است.
جستجوی اعتراضات و تظاهرات در کنار هم
نکته: حروف عبارت OR باید به صورت بزرگ (Capital Letter) تایپ شوند. به جای عبارت OR از علامت | (در ویندوز Shift + \) نیز میتوان استفاده کرد.
۵. اپراتور filetype: برای جستجوی عبارت در یک فایلهایی با فرمت خاص متنی
دستور filetype گوگل زمانی کاربرد دارد که بخواهید متن مورد نظر را در فایل هایی با یک فرمت و پسوند ذخیره سازی مشخص جستجو کنید.
استفاده ویژه این دستور شاید برای محققان، دانشجویان و دانش آموزان باشد! مثلا فرض کنید باید تحقیقی درباره سواد رسانه آماده کنید اما زمان کافی ندارید! برای پیدا کردن پاورپوینت «سواد رسانه ای» کافیست در گوگل کوئری زیر را سرچ کنید:
سواد رسانه ای filetype:pptx
این کوئری، جستجو را نمایش نتایج مربوط به عبارت سواد رسانه ای صرفا در فایل های پاورپوینت (پسوند فایل های پاورپوینت ppt یا pptx است) است. همین کار را میتوانید برای پیدا کردن فایل های ورد یا پی دی اف درباره سواد رسانه ای انجام دهید. کافیست پس از عبارت filetype، بدون فاصله تایپ کنید pdf یا docx.
جستجوی پاورپوینت سواد رسانه ای در گوگل
لازم است توجه کنید که چون محور جستجو در گوگل، عبارات و کلمات هستند، فقط فرمت های متنی قابل جستجو هستند! این فرمت ها و نرم افزار های مربوط به آنها عبارتند از:
- filetype:swf (Adobe Flash File)
- filetype:pdf (Portable Document Format)
- filetype:ps (Adobe PostScript)
- filetype:dwf (AutoDesk Design Web Format)
- filetype:kml (Google Earth)
- filetype:xls یا filetype:xlsx (Microsoft Excel)
- filetype:ppt یا filetype:pptx (Microsoft PowerPoint)
- filetype:doc or filetype:docx (Microsoft Word)
- filetype:odp (OpenOffice Presentation)
- filetype:ods (OpenOffice Spreadsheet)
- filetype:odt (OpenOffice Text)
- filetype:rtf (Rich Text Format)
- filetype:txt یا filetype:text (Text)
- filetype:wpm (Wireless Markup Language)
- filetype:xml (Extensible Markup Language
از دیگر فرمت هایی که کمتر رایج هستند اما می توانند مورد استفاده برنامهنویسان و توسعه دهندگان وب برای پیدا کردن یک محتوای متنی در صفحات اینترنتی با فرمت کدنویسی خاص قرار گیرند، عبارتند از:
html / bas / c / cc / cpp / cxx / h / hpp / cs / java / pl / py
۶. اپراتور site: برای جستجوی محدود به دامنه
اپراتور Site وقتی استفاده میشود که صرفا در یک سایت خاص دنبال عبارتی بگردید یا بخواهید نتایج یک دامنه خاص را حذف کنید. (ترکیب با اپراتور منها)
مثلاً فرض کنید بعد از آنکه متوجه وجود اعتراضات جلیقه زردها در اسرائیل شدیم، خط خبری آنرا در سایت بی بی سی دنبال کنیم و ببینیم موضع این سایت به اعتراضات در اسرائیل چه بوده است؟ کوئری زیر را جستجو میکنیم:
“israel” yellow vests site:bbc.com
بررسی پوشش خبری بی بی سی از اعتراضات جلیقه زردها در اسرائیل
همان طور که ملاحظه میکنید از مقایسه نتایج سایت بی بی سی با نتیجه جستجوی عادی، اینطور به نظر BBC هیچ پرداختی درباره این اعتراضات در اسرائیل نداشته و شاید به نوعی آنرا بایکوت کرده است.
البته در استفاده از این دستور باید توجه کنید که میان دستور سایت و آدرس دامنه هیچ فاصله ای نباید قرار دهید.
ترکیب اپراتورها و دستورات سرچ گوگل
اما استفاده از دستورات و اپراتور های سرچ حرفه ای در گوگل زمانی کاربرد خود را نشان می دهد که با ترکیب آنها بتوانید منظور خود را از طریق کوئری مناسب به گوگل بفهمانید و به نتایج مورد نظر برسید.
برای مثال فرض کنید می خواهیم کد ملی تعدادی دانشجو را پیدا کنیم و ببینیم آیا سایت دانشگاه ها نشتی اطلاعاتی دارند یا نه. لذا به دنبال یک گزارش (مثلا با پسوند pdf) در سر دامنه عمومی سایت های دانشگاهی ایران (ac.ir) میگردیم. نتیجه تقریبا دردآور است…!
جستجوی فایل حاوی کد ملی در سایت های دانشگاهی
تصویر بالا (تقریبا) تمام فایل های pdf حاوی عبارت «کد ملی» موجود در سایت های دانشگاهی ایران است. و متاسفانه بخشی از این فایل ها، حاوی نام و نام خانوادگی دانشجویان و برخی مشخصات دیگر آنها از جمله کد ملی ایشان است…
فایل کد ملی دانشجویان یافت شده در گوگل
همان طور که ملاحظه می کنید، با یک یک جستجوی هوشمند و پیشرفته در گوگل، بدون هک یا کار غیر قانونی، توانستیم به این فایل خاص برسیم. اینکه انتشار این فایل به عمد یا ناخواسته بوده جای سوال دارد اما در سوی مقابل اینکه این فایل چه استفاده ای میتواند داشته باشد متناسب شدت پلید بودن یابنده قابل تغییر است…! اما اینجاست که جا دارد یادآوری کنیم آموزش اوسینت برای حفظ حریم خصوصی تا چه حد ضروری است…!