Google Sitemap

Was macht diese Extension ?

Diese Extensions erstellt, anhand des Typo3 Seitenbaums, eine sitemap.xml für die großen Suchmaschinen wie z.b. Google.

Konfiguration

pid_list gibt die SeitenID der Seite an, wo die Extension zu suchen anfangen soll
recursive wieviele Ebenen sollen durchsucht werden (0 = alle Ebenen; Default: 0)
domain gibt die Hauptdomain der Links an. Wenn kein Link angegeben, wird die REQUEST URI genommen
allowedDoktypes erlaubte Dokytypes (Default: 2,1)
languageVar setzt den Namen der Sprach GET Variable (Default: L)
showLanguages gibt an, welche Sprachen angezeigt werden sollen (Default: 0)
defaultLanguageID setzt die Defaultsprache (damit wird z.b. „L=0“ bei den Links verhindert)

TypoScript

sitemap = PAGE
sitemap {
  typeNum = 200
  10 >
  10 < plugin.tx_weeaargooglesitemap_pi1
  10.pid_list = 2
  10.recursive = 0
  10.allowedDoktypes = 2,1,4
  10.domain = www.weeaar.com
  config {
    disableAllHeaderCode = 1
    additionalHeaders = Content-type:text/xml
    no_cache = 1
    admPanel = 0
    xhtml_cleaning = 0
  }
}

Damit die Sitemap.xml Datei auch unter diesem Namen zugreifbar ist, muss man RealURL wie folgt konfigurieren (Änderungen sind Fett hervorgehoben):

RealURL Konfiguration

      .
    .
    .
    'fileName' => array(
            'defaultToHTMLsuffixOnPrev'=>1,
            'index' => array(
                'rss.xml' => array(
                    'keyValues' => array(
                        'type' => 100,
                    ),
                ),
                'rss091.xml' => array(
                    'keyValues' => array(
                        'type' => 104,
                    ),
                ),
                'rdf.xml' => array(
                    'keyValues' => array(
                        'type' => 101,
                    ),
                ),
                'atom.xml' => array(
                    'keyValues' => array(
                        'type' => 103,
                    ),
                ),
                'atom03.xml' => array(
                    'keyValues' => array(
                        'type' => 102,
                    ),
                ),
                'sitemap.xml' => array(
                    'keyValues' => array(
                        'type' => 200,
                    ),
                ),

            ),
        ),
    ),
    .
    .
    .

Spezialeinstellungen

Im Menüpunkt Web->Google Sitemap ist es möglich, weitere Einstellung für jede Seite vorzunehmen. Dazu gehörten z.b. die Änderungsfequenz oder die Priorität der einzelnen Seiten.

Newslink in der Sitemap.xml anzeigen

Seit der Version 0.3.3 ist es möglich, die dynamischen Newslinks in die Sitemap Datei einzubeziehen. Damit dieses Funktioniert, müssen folgende Zeilen im TypoScript Code hinzugefügt werden:

sitemap = PAGE
sitemap {
  typeNum = 200
  10 >
  10 < plugin.tx_weeaargooglesitemap_pi1
  10.pid_list = 174
  10.domain = www.weeaar.com
  10.tt_news.single_page {
    1 = 221
    1.pid_list = 222
    
    2 = 214
    2.pid_list = 213
  }
  10.tt_news {
    disabledParameter = day,month,year
  }
}

tt_news.single_page.X PageID der Single Page von tt_news
tt_news.single_page.X.pid_list Die ID des StorageFolders von tt_news
tt_news.disabledParameter Definiert, welcher Parameter nicht in der URL auftauchen soll (wichtig für Archivierte News)
tt_news.single_page.X.cat_id_list Nur News dieser Kategorie anzeigen

Hat man mehr als einen News Ordner, so ist es möglich, durch tt_news.single_page.2 oder .3 oder .4 etc. diese anzugeben. Wenn der Parameter „disableParameter“ nicht gesetzt ist, würde der Link z.b. wie folgt aussehen:

http://www.weeaar.com/projekte/typo3-extensions/patches/patches/archive/2007/february/article/flexform-getfield.html

Wird der Prameter auf „day,month,year“ gesetzt, so würde die URL so aussehen:

http://www.weeaar.com/projekte/typo3-extensions/patches/article/flexform-getfield.html

Seit der version 0.4.2 wird der parameter „publication_date“ angezeigt. Dieser ist wichtig für Google News.

Einrichten des Sitemap.org Protokolls

In Version 0.4.2 ist das Schema für Sitemap.org hinzugekommen. Um dieses Schema zu nutzen muss im TS der Code an folgender Stelle geändert werden:

TypoScript

10.defaultCode = sitemap_org

Es ist nur „google“ oder „sitemap_org“ möglich. Der Standard ist „google“.

Bekanntmachen der URL's bei Google

Seit der Version 0.4.5 ist es vom Backend aus möglich, die Sitemap.xml URL's an Google zu übergeben.

Um die Datei an Google zu übergeben, gibt es in Web->GoogleSitemap einen neuen Punkt „Sitemap Update“. Nach auswählen dieses Menüpunktes muss man sich auf eine Seite begeben, wo DomainObjekte definiert sind.

Auf dieser Seite sieht man die jeweiligen Domains und kann diesen den Path zu den Sitemap.xml Dateien angeben und an google Senden.

WICHTIG: nur wenn Curl installiert ist, funktioniert dieses Feature.

Sitemap.xml über Robots.txt bekanntgeben

Ebenfalls ist es möglich, die Sitemap Datei in der Robots.txt Datei anzugeben.

Robots.txt

sitemap: www.weeaar.com/sitemap.xml

Nach Eingabe dieser Zeile in der Robots.txt finden die Suchmaschinen die Sitemap Datei.

Hat man nicht die Rechte um diese Datei im Filesystem anzulegen, so kann man die Extension weeaar_robotstxt nutzen.