Chrome браузеріне арналған скрабтарды кеңейту туралы Semalt нұсқаулығы

Кез-келген бизнестің өмір сүруі және сайып келгенде өсуі үшін бәсекелестерден және түрлі қауіптерден озып кету керек. Аналитикалық мәліметтер негізінде шешім қабылдау - бұл проблемаларды ұмытып кетудің сенімді әдісі. Мұндай деректерді жинау арқылы алуға болады. Бұл жерде Chrome үшін қырғышты кеңейту мүмкіндігі пайда болады: бұл деректерді жинау процесін жеңілдетіп қана қоймайды, сонымен қатар күрделі орнатуларсыз жолда тырнауға мүмкіндік береді.
Scraper-ті қалай пайдалану керек
1. Ең алдымен, кеңейтімді орнату керек, сондықтан Chrome веб-дүкеніне өтіп, «қырғышты» іздеңіз және Chrome-ға қосуды нұқыңыз.
2. Сіз деректерді өшіргіңіз келетін веб-сайтқа өтіп, оны қызықтыратын жазбаны бөлектеу арқылы белгілеңіз. Оны тінтуірдің оң жақ батырмасымен шертіп, пайда болатын мәзірден «ұқсас сызықтарды» таңдаңыз.
3. Олай істегенде қырғыштың жеке консоль терезесі ашылады. Мұнда сіз қиылған деректердің тізімін көресіз.
4. Мазмұнды сақтау үшін «Google құжаттарына сақтау» түймесін басыңыз, бұл автоматты түрде Google кестесіне экспортталады.

Ұзартылған қырғыштар
Егер сіз көбірек деректерді жоятын болсаңыз, онда сіз кеңейтілген әдісті қолдана аласыз. Егер сіз HTML туралы білетін болсаңыз, құралмен жұмыс істеу әлдеқайда жеңіл болатынын ескеріңіз. Деректерді уақыт сериялары деректері негізінде мұрағаты бар дерек көзінен қиып алғыңыз келді делік. Мұндай жағдайда, егер сіз жоғарыда сипатталған әдісті қолданып көрсеңіз, сіз жалған мәліметтерді аласыз.
Бұл мәселені шешу үшін сіз XPath деп аталатын HTML және XML сұрау тілін қолдана аласыз. Ол не істейді? XPath әр таңдаудағы әр түрлі элементтер туралы деректерді таниды. Мұнда қалай жүруге болатындығы туралы нұсқаулық төменде берілген:
1. Scraper консоліне өтіңіз, жоғарғы сол жақта сіз «XPath» батырмасын байқап, оны нұқып, бастапқы кестені құрастыруды жалғастырыңыз.
2. Сізге дұрыс элемент үшін XPath жазу керек. Бүкіл ақпаратты қамтитын қазіргі XPath келесідей «// div [3] / div [3] / div [2] / div» форматында шығады. <div> элементтерін HTML құжатында компьютер таниды.
3. Танылған деректерді бөлу үшін Scraper бағандарын пайдалану керек. Мұны істеу үшін сіз қол жетімді ақпараттың әртүрлі түрлерін іздеуіңіз керек. Мәліметтерге байланысты сізде тақырыптар болуы мүмкін. Бұл тақырыптар барлық мәліметтер жиынтығының қасында орналасқан. Олар тегпен бірге жүреді, бұл жағдайда <b> тег.
4. Тексеру элементін қолдана отырып, XPath-қа <b> тегті тауып, қосыңыз. Енді сіз осы бірінші бағанды «тақырып бағанасы» ретінде белгілей аласыз, себебі ол тақырыптар тізімінде болады. Сізге қажет әр баған үшін әр түрлі XPath жолдарын жасаңыз.
5. Скрапты шертіңіз, сонда кеңейтім автоматты түрде деректерді жинайды және сіз орнатқан әртүрлі бағандарға жинайды.