कसरी ठूलो साइट क्रोल गर्ने र स्क्रिमि F फ्रुगको एसईओ स्पाइडर प्रयोग गरेर डाटा निकाल्ने

भ्यागुता एसईओ स्पाइडर चिच्याउँदै

हामी अहिले थुप्रै ग्राहकहरूलाई सहयोग गर्दै छौं मार्केटो माइग्रेसनहरू। ठूला कम्पनीहरूले उद्यम समाधानहरू जस्तो प्रयोग गर्छन्, यो स्पाइडर वेबको जस्तो छ जुन प्रक्रियामा र प्लेटफर्ममा आफैंलाई बुनेको छ वर्षौंदेखि कम्पनीहरूले प्रत्येक टचपोइन्टको बारेमा पनि सचेत छैनन्।

मार्केटो जस्ता उद्यम मार्केटिंग अटोमेसन प्लेटफर्मको साथ, फारमहरू साइटहरू र ल्यान्डि pages पृष्ठहरूमा डाटाको प्रविष्टि पोइन्ट हुन्। कम्पनीहरूसँग प्राय: हजारौं पृष्ठहरू र सयौं फारमहरू हुन्छन् जुन उनीहरूको साइटहरूमा अपडेट गर्नका लागि पहिचान गर्न आवश्यक पर्दछ।

यसको लागि एक उत्तम उपकरण हो फ्र्यागको एसईओ स्पाइडर चिच्याउँदै... सायद क्रलिंग, अडिटिंग, र साइटबाट डाटा निकाल्ने मार्केटको सबैभन्दा लोकप्रिय प्लेटफर्म। प्लेटफर्म सुविधा-धनी छ र सयौं विकल्पहरू प्रदान गर्दछ जुन तपाईंलाई आवश्यक प्रत्येक कार्यको लागि।

फ्र्याम एसईओ स्पाइडर चिच्याउँदै: क्रल र एक्स्ट्र्याक्ट

फ्रिम एसईओ स्पाइडर चिच्याउने मुख्य कुञ्जी यो छ कि तपाईं कस्टम एक्सट्रैसनको आधारमा प्रदर्शन गर्न सक्नुहुनेछ रेजेक्स, XPathवा CSSPath विशिष्टता। यो अत्यन्त उपयोगीमा आउँदछ किनकि हामी ग्राहकको साइटहरू क्रल गर्न चाहन्छौं र पृष्ठहरूबाट MunchkinID र formId मानहरू अडिट गर्न र क्याप्चर गर्न चाहन्छौं।

उपकरणको साथ, खोल्नुहोस् कन्फिगरेसन> अनुकूलन> निकासी तत्वहरू पहिचान गर्न को लागी तपाईंले निकाल्न चाहानुहुन्छ।

screamingfrog अनुकूलन निकासी

एक्स्ट्र्यासन स्क्रिनले लगभग असीमित डाटा स collection्कलनको लागि अनुमति दिन्छ:

भ्यागुता एसईओ स्पाइडर एक्स्ट्र्यासन नियमहरू

Regex, XPath, र CSSPath एक्स्ट्रक्शन

MunchkinID को लागि, परिचयकर्ता पृष्ठ भित्र रहेको फर्म स्क्रिप्ट भित्र अवस्थित छ:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

हामी त्यसपछि एक लागू गर्छौं Regex नियम स्क्रिप्ट ट्याग भित्रबाट आईडी क्याप्चर गर्न जुन पृष्ठमा सम्मिलित गरिएको छ:

Regex: ["']id["']: *["'](.*?)["']

फारम आईडीको लागि, डाटा मार्केटो फारम भित्र एउटा इनपुट ट्यागमा छ:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

हामी एक लागू गर्छौं XPath नियम पृष्ठमा सम्मिलित गरिएको फारमबाट आईडी क्याप्चर गर्न। XPath क्वेरी एक नामको साथ एक इनपुटको साथ फारमको लागि खोजी गर्दछ बलियो, त्यसपछि निकासीले बचत गर्दछ मूल्य:

XPath: //form/input[@name="formid"]/@value

भ्यागुता एसईओ स्पाइडर जाभास्क्रिप्ट रेन्डरिंग

चीमिंग फ्रुगको अर्को उत्तम विकल्प यो हो कि तपाईं पृष्ठमा HTML मा सीमित हुनुहुन्न, तपाईं कुनै पनि जाभास्क्रिप्ट रेन्डर गर्न सक्नुहुन्छ जुन तपाईंको साइट भित्र फारमहरू घुसाउन गइरहेको छ। भित्र कन्फिगरेसन> माकुरो, तपाइँ रेन्डरिंग ट्याबमा जान सक्नुहुन्छ र यसलाई सक्षम गर्नुहोस्।

भ्यागुता एसईओ स्पाइडर जाभास्क्रिप्ट रेन्डरिंग

निश्चित रूपमा साइट क्रल गर्न यसले केहि लामो समय लिन सक्दछ, तर तपाईं जाभास्क्रिप्टद्वारा ग्राहक-साइड रेन्डर गरिएको फारमहरू साथै सर्भर साइड घुसाइएको फारमहरू पाउनुहुनेछ।

जबकि यो एकदम विशिष्ट अनुप्रयोग हो, यो अविश्वसनीय रूपले उपयोगी छ किनकि तपाईं ठूला साइटहरूको साथ काम गर्दै हुनुहुन्छ। तपाइँ बिल्कुल अडिट गर्न चाहानुहुन्छ जहाँ तपाइँका फारमहरू साइट भरि इम्बेड गरिएको छ।

डाउनलोड चिच्याउने फ्रुग एसईओ स्पाइडर

तिम्रो के बिचार छ?

यो साइट स्प्याम कम गर्न Akismet को उपयोग गर्दछ। जान्नुहोस् कि तपाईंको डेटा कसरी संसाधित छ.