Как разбить файл sitemap.xml на несколько файлов?

Существует несколько способов разбить большой файл sitemap.xml на несколько файлов. Вот два из них:

  1. Разделение на несколько файлов по количеству URL-адресов:
    • Найдите общее количество URL-адресов в вашем файле sitemap.xml.
    • Разделите это число на желаемое количество файлов, чтобы получить примерное количество URL-адресов в каждом файле.
    • Создайте новые файлы sitemap1.xml, sitemap2.xml, и т.д.
    • Скопируйте необходимое количество URL-адресов из исходного файла sitemap.xml в каждый новый файл.
    • Удалите скопированные URL-адреса из исходного файла, чтобы избежать дублирования.
  2. Разделение на несколько файлов по размеру:
    • Определите максимальный размер файла, который вы хотите иметь для каждого раздела.
    • Используйте текстовый редактор или командную строку для открытия файла sitemap.xml.
    • Постепенно скопируйте URL-адреса из исходного файла и добавляйте их в новый файл sitemap1.xml, пока он не достигнет заданного размера.
    • Продолжайте этот процесс, создавая sitemap2.xml, sitemap3.xml и т.д., пока не закончатся URL-адреса в исходном файле.
    • Удалите скопированные URL-адреса из исходного файла, чтобы избежать дублирования.

Не забудьте обновить ссылки на эти новые файлы в вашем основном sitemap.xml, чтобы поисковые системы знали о вашей новой структуре разделения.

Как сделать ссылки на новые файлы в основном sitemap.xml

Если у вас есть основной файл sitemap.xml и вы хотите добавить ссылки на новые файлы sitemap1.xml, sitemap2.xml и т.д., можно использовать следующий код для редактирования основного файла:

    
    <!-- Открываем основной файл sitemap.xml -->
    <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
      
      <!-- Добавляем ссылку на новый файл sitemap1.xml -->
      <sitemap>
        <loc>https://example.com/sitemap1.xml</loc>
      </sitemap>
      
      <!-- Добавляем ссылку на новый файл sitemap2.xml -->
      <sitemap>
        <loc>https://example.com/sitemap2.xml</loc>
      </sitemap>
      
      <!-- Добавляем ссылку на новый файл sitemap3.xml -->
      <sitemap>
        <loc>https://example.com/sitemap3.xml</loc>
      </sitemap>
      
      <!-- и так далее... -->
      
    </sitemapindex>
    

Замените "https://example.com" на адрес вашего веб-сайта и укажите соответствующие имена новых файлов sitemap.xml.

После внесения изменений сохраните и загрузите обновленный файл sitemap.xml на ваш сервер. После этого поисковые системы будут знать о новых файловых структурах и смогут их правильно индексировать.

В Новых файлах нужно добавлять в код <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> или нет?

Нет, в новых файлах sitemap1.xml, sitemap2.xml и т.д. не нужно добавлять xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">.<sitemapindex>

Этот элемент <sitemapindex> используется только в основном файле sitemap.xml, чтобы указать список других sitemap-файлов. В каждом отдельном файле sitemap не должно быть <sitemapindex>, так как каждый файл представляет собой отдельный sitemap и не содержит ссылок на другие файлы.

В новых файлах sitemap.xml должна быть только структура <urlset>, содержащая информацию о каждом конкретном URL-адресе, например:

    
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    
        <!-- Пример URL -->
        <url>
            <loc>https://example.com/page1.html</loc>
            <lastmod>2021-05-01</lastmod>
            <changefreq>weekly</changefreq>
            <priority>0.8</priority>
        </url>
    
        <!-- Пример URL -->
        <url>
            <loc>https://example.com/page2.html</loc>
            <lastmod>2021-05-05</lastmod>
            <changefreq>monthly</changefreq>
            <priority>0.5</priority>
        </url>
    
         <!-- и так далее... -->
    
    </urlset>
    

Убедитесь, что новые файлы sitemap1.xml, sitemap2.xml и т.д. содержат только <urlset> с информацией о каждом URL-адресе без <sitemapindex>.

В строчке <lastmod>2021-05-05</lastmod> какую дату вставлять?

В элементе <lastmod>2021-05-05</lastmod> вы должны указать дату последнего изменения соответствующей страницы.

Это означает, что вам нужно вставить актуальную дату последнего изменения содержимого страницы. Если вы делаете изменения на странице сегодня, то можно указать текущую дату. Если последнее изменение было выполнено в прошлом, то нужно указать соответствующую дату.

Формат даты должен быть в соответствии с правилами XML и представляться в виде "ГГГГ-ММ-ДД", где "ГГГГ" - год, "ММ" - месяц и "ДД" - день. Например, если последнее изменение было выполнено 5 мая 2021 года, то вы можете использовать <lastmod>2021-05-05</lastmod>.