कसरी ठूलो साइट क्रोल गर्ने र स्क्रिमि F फ्रुगको एसईओ स्पाइडर प्रयोग गरेर डाटा निकाल्ने

भ्यागुता एसईओ स्पाइडर चिच्याउँदै

हामी अहिले थुप्रै ग्राहकहरूलाई सहयोग गर्दै छौं मार्केटो माइग्रेसनहरू। ठूला कम्पनीहरूले उद्यम समाधानहरू जस्तो प्रयोग गर्छन्, यो स्पाइडर वेबको जस्तो छ जुन प्रक्रियामा र प्लेटफर्ममा आफैंलाई बुनेको छ वर्षौंदेखि कम्पनीहरूले प्रत्येक टचपोइन्टको बारेमा पनि सचेत छैनन्।

मार्केटो जस्ता उद्यम मार्केटिंग अटोमेसन प्लेटफर्मको साथ, फारमहरू साइटहरू र ल्यान्डि pages पृष्ठहरूमा डाटाको प्रविष्टि पोइन्ट हुन्। कम्पनीहरूसँग प्राय: हजारौं पृष्ठहरू र सयौं फारमहरू हुन्छन् जुन उनीहरूको साइटहरूमा अपडेट गर्नका लागि पहिचान गर्न आवश्यक पर्दछ।

यसको लागि एक उत्तम उपकरण हो फ्र्यागको एसईओ स्पाइडर चिच्याउँदै... सायद क्रलिंग, अडिटिंग, र साइटबाट डाटा निकाल्ने मार्केटको सबैभन्दा लोकप्रिय प्लेटफर्म। प्लेटफर्म सुविधा-धनी छ र सयौं विकल्पहरू प्रदान गर्दछ जुन तपाईंलाई आवश्यक प्रत्येक कार्यको लागि।

फ्र्याम एसईओ स्पाइडर चिच्याउँदै: क्रल र एक्स्ट्र्याक्ट

फ्रिम एसईओ स्पाइडर चिच्याउने मुख्य कुञ्जी यो छ कि तपाईं कस्टम एक्सट्रैसनको आधारमा प्रदर्शन गर्न सक्नुहुनेछ रेजेक्स, XPathवा CSSPath निर्दिष्ट यो अत्यन्त उपयोगीमा आउँदछ किनकि हामी ग्राहकको साइटहरू क्रल गर्न चाहन्छौं र पृष्ठबाट MunchkinID र formId मानहरू अडिट गर्न र क्याप्चर गर्न चाहन्छौं।

उपकरणको साथ, खोल्नुहोस् कन्फिगरेसन> अनुकूलन> निकासी तत्वहरू पहिचान गर्न को लागी तपाईंले निकाल्न चाहानुहुन्छ।

screamingfrog अनुकूलन निकासी

एक्स्ट्र्यासन स्क्रिनले लगभग असीमित डाटा स collection्कलनको लागि अनुमति दिन्छ:

भ्यागुता एसईओ स्पाइडर एक्स्ट्र्यासन नियमहरू

Regex, XPath, र CSSPath एक्स्ट्रक्शन

MunchkinID को लागि, पहिचानकर्ता फारम स्क्रिप्ट भित्र अवस्थित हुन्छ जुन पृष्ठ भित्र छ:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

हामी त्यसपछि एक लागू गर्छौं Regex नियम स्क्रिप्ट ट्याग भित्रबाट आईडी क्याप्चर गर्न जुन पृष्ठमा सम्मिलित गरिएको छ:

Regex: ["']id["']: *["'](.*?)["']

फारम आईडीको लागि, डाटा मार्केटो फारम भित्र एउटा इनपुट ट्यागमा छ:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

हामी एक लागू गर्छौं XPath नियम पृष्ठमा सम्मिलित गरिएको फारमबाट आईडी क्याप्चर गर्न। XPath क्वेरी एक नामको साथ एक इनपुटको साथ फारम खोज्दछ formid, त्यसपछि निकासीले बचत गर्दछ मूल्य:

XPath: //form/input[@name="formid"]/@value

भ्यागुता एसईओ स्पाइडर जाभास्क्रिप्ट रेन्डरिंग

चीमिंग फ्रुगको अर्को उत्तम विकल्प यो हो कि तपाईं पृष्ठमा HTML मा सीमित हुनुहुन्न, तपाईं कुनै पनि जाभास्क्रिप्ट रेन्डर गर्न सक्नुहुन्छ जुन तपाईंको साइट भित्र फारमहरू घुसाउन गइरहेको छ। भित्र कन्फिगरेसन> माकुरो, तपाइँ रेन्डरिंग ट्याबमा जान सक्नुहुन्छ र यसलाई सक्षम गर्नुहोस्।

भ्यागुता एसईओ स्पाइडर जाभास्क्रिप्ट रेन्डरिंग

निश्चित रूपमा साइट क्रल गर्न यसले केहि लामो समय लिन सक्दछ, तर तपाईं जाभास्क्रिप्टद्वारा ग्राहक-साइड रेन्डर गरिएको फारमहरू साथै सर्भर साइड घुसाइएको फारमहरू पाउनुहुनेछ।

जबकि यो एकदम विशिष्ट अनुप्रयोग हो, यो अविश्वसनीय रूपले उपयोगी छ किनकि तपाईं ठूला साइटहरूसँग काम गर्दै हुनुहुन्छ। तपाइँ बिल्कुल अडिट गर्न चाहानुहुन्छ जहाँ तपाइँका फारमहरू साइट भरि इम्बेड गरिएको छ।

डाउनलोड चिच्याउने फ्रुग एसईओ स्पाइडर

तिम्रो के बिचार छ?

यो साइट स्प्याम कम गर्न Akismet को उपयोग गर्दछ। जान्नुहोस् कि तपाईंको डेटा कसरी संसाधित छ.