Chrome üçün Scraper uzadılması haqqında Semalt Bələdçi

Hər hansı bir işin sağ qalması və nəticədə böyüməsi üçün rəqiblərindən və müxtəlif risklərdən qabaq durmaq lazımdır. Analitik məlumatlara əsaslanaraq qərar qəbul etmək bu problemləri unutmağın etibarlı bir yoldur. Bu cür məlumatlar məlumatların yığılması ilə əldə edilə bilər. Budur, Chrome üçün asan kazıyıcı uzantısı gəlir: bu, yalnız məlumatların yığılması prosesini asanlaşdırmayacaq, həm də mürəkkəb tənzimləmələr olmadan yolda qaşınma imkanı verəcəkdir.

Scraper istifadə necə

    1. Etməyiniz lazım olan ilk şey, genişləndirməni quraşdırmaqdır, buna görə xrom veb mağazasına keçin, "kazıyıcı" axtarın və Chrome-a əlavə et düyməsini basın.

    2. Verilənləri silmək istədiyiniz veb saytına gedin, maraqlandığınız qeydi qeyd edərək qeyd edin. Bunun üzərinə sağ vurun və açılan menyuda "oxşar qırıntıları" seçin.

    3. Bunu etmək ayrı bir kazıyıcı konsol pəncərəsini açacaqdır. Burada qırılmış məlumatların siyahısını görəcəksiniz.

    4. Məzmunu saxlamaq üçün "Google sənədlərinə saxla" düyməsini basın, bu avtomatik olaraq məlumatları Google cədvəlinə ixrac edəcəkdir.

Geniş qırıntı

Daha çox məlumat yığmağı planlaşdırırsınızsa, qabaqcıl yanaşmadan istifadə edə bilərsiniz. Diqqət yetirin, HTML ilə bağlı bəzi bilgiləriniz varsa alətlə işləmək daha asan olacaq. Zaman seriyası məlumatlarına əsaslanan bir arxivi olan bir mənbədən məlumatları silmək istədin deyin. Bu vəziyyətdə, yuxarıda göstərilən üsulu sınasanız, zibillənmiş məlumatları alacaqsınız.

Bu məsələni həll etmək üçün XPath kimi tanınan bir HTML və XML sorğu dilindən istifadə edə bilərsiniz. Bu nə edir? XPath hər seçimdə olan fərqli elementlərlə bağlı məlumatları tanıyır. Aşağıda bu barədə necə məlumat verilmişdir:

1. Scraper konsoluna gedin, yuxarı sol tərəfdə "XPath" düyməsini görməli, üzərinə vurun və ilkin cədvəlin yığılmasına davam edin.

2. Doğru element üçün XPath yazmalısınız. Bütün məlumatları özündə cəmləşdirən hazırkı XPath bu kimi bir formatda göstərilir "// div [3] / div [3] / div [2] / div". <div> elementləri kompüter tərəfindən HTML sənədində tanınacaqdır.

3. Tanınmış məlumatları ayırmaq üçün Scraper sütunlarından istifadə etməlisiniz. Bunu etmək üçün əlinizdə olan müxtəlif məlumat növlərini axtarmaq lazımdır. Tərtib etdiyiniz məlumatlardan asılı olaraq başlıqlarınız ola bilər. Bu başlıqlar hər məlumat dəstinin yanında mövcuddur. Bunlara bir etiket, bu vəziyyətdə bir <b> etiket müşayiət olunur.

4. Təftiş elementindən istifadə edərək XPath'a <b> etiket tapın və əlavə edin. İndi bu ilk sütunu "başlıq sütunu" olaraq etiketləyə bilərsiniz, çünki başlıqların siyahısı veriləcəkdir. Lazım olan hər sütun üçün fərqli XPathlar yaratmağa davam edin.

5. Qırıntıları vurun və uzantı avtomatik olaraq məlumatları yığacaq və təyin etdiyiniz fərqli sütunlara təşkil edəcəkdir.