Pobieranie informacji o stronach internetowych, na których znajdują się kreacje reklamowe.
8 marca 2021W celu dobrania odpowiednich reklam do danej podstrony konieczne jest pobranie treści ze stron internetowych, na których znajduje się jednostka reklamowa. W tym celu w systemie zaimplementowany jest prosty program pobierający niezbędne informacje, które posłużą następnie, jako podstawa do dobrania reklamy. Program pobiera tylko dane ze stron, na których znajdują się widgety pobrane z systemu i dodatkowo strona została już, co najmniej raz odwiedzona przez użytkownika wykorzystującego przeglądarkę z włączoną obsługą javascriptu. Podejście to zostało wybrane, ponieważ pobranie informacji z całej strony mogłoby potrwać zbyt długo, a dodatkowo pobrane zostałyby podstrony rzadko lub w ogóle nieodwiedzane przez użytkowników. Dzięki ograniczeniu działania systemu tylko do działających podstron możliwe jest zaoszczędzenie zasobów oraz lepsze zarządzanie reklamami. Gdy strona spełnia wyżej wymienione warunki zostaje ona przeskanowana specjalnym programem, który pobiera takie dane jak:
– Tekst umieszczony w elemencie
Po co jest favicon na stronie internetowej
– Słowa kluczowe umieszczone w meta taguKeywords, które używane będą tylko we wstępnej fazie dobierania reklam. Ich znaczenie jest minimalne jednak dane zawarte w nich pozwolą dobrać szybko reklamy, które mogą pasować do danej strony, zanim uda się dobrać reklamy lepiej pasujące do danej podstrony.
– Opis strony umieszczony w metatagudescription, wykorzystywany jest w procesie szczegółowego dobierania reklam.
– Słowa wyróżnione przy pomocy tagów oraz tagów nagłówków
– Treść strony zostaje pobrana, jako ostatnia i jest jedną z głównych jednak nie jest najważniejszym czynnikiem decydującym o dobraniu danej reklamy do strony. Spowodowane jest to dużą ilością tekstu, w porównaniu do parametrów wymienionych wcześniej. W przypadku wielu serwisów stosunek tekstu znajdującego się na stronie, do tekstu w wymienionych parametrach wynosi 1:20 a czasami nawet więcej. I choć treść strony jest bardzo istotna, to nie jest traktowana, jako główny parametr decydujący o dobraniu reklamy. Powodem takiego stanu rzeczy jest właśnie ogromna ilość tekstu na stronach, co sprawia, że dobranie reklamy mogłoby pochłaniać wiele zasobów, które potrzebne są do prawidłowego działania serwisu.