Project

General

Profile

Bug #1731

Brug af facetter kan ikke spores i Webtrends

Added by Niels Frandsen over 3 years ago. Updated almost 2 years ago.

Status:
Closed
Priority:
None
Assignee:
Estimated time:
URL med eksempel:
Kategorier:
Administration - Systemkonfiguration, Driftsvedligehold - Refaktorering (Opdatering af kodebasen)

Description

Brug af facetter fra et givent søgeresultat kan ikke dokumenteres via Webtrends. Vi ønsker at kunne foretage mere detaljeret analyse af navigation på hjemmesiden - herunder brug af enkelt-faciliteterne i søgeresultat-visningen.
Vi har kontakt til KPI, som vil kunne kvalificere et bud på en løsning.

History

#1 Updated by Michael Anker over 3 years ago

KPI gætter på at det er et problem med domæner. Vi ved ikke om det er sagen, men her er forklaringen

Ballerups hjemmeside hedder
https://bib.ballerup.dk

men har også domænet
https://ballerup.ddbcms.dk/

Når man klikker på en facet. F.eks. Film (Net) under facetten Materialetype
https://bib.ballerup.dk/search/ting/pilcher?facets[]=facet.type%3Afilm%20%28net%29

Så får man en ny unik URL, som burde indgå i statistikken. Da vi snakkede med KPI, der forklarede de at hvis scriptet har opfattelsen, at det den skal spore er fra bib.ballerup.dk og den side som i virkeligheden loader er ballerup.ddbcms.dk selvom URLen står som den rigtige, så vil den ikke indberette siden til måling.

Det underbygges med at de præfabrikerede søgninger vi har, hvor vi linker til en søgning med den absolutte url som optræder det faktisk i statistikken, men at de ikke optræder når man klikker på dem i en søgning. Vi ved at de burde optræde, da vi selv bruger facetterne.

#2 Updated by Rolf Madsen over 3 years ago

  • Status changed from New to Needs analysis
  • Target version set to DDB CMS 2016 2. opgradering
  • Kategorier Driftsvedligehold - Refaktorering (Opdatering af kodebasen) added

#3 Updated by Steen Larsen over 3 years ago

Selvom oplysningerne faktisk blev sendt til Webtrends hvor skulle jeg så finde disse oplysninger?
Sammen med søgeudtrykket? Sider vises uden parametre (f.eks. rapporten "Site Pages" ) - og facetterne er jo en parameter. Men det kan KPI måske svare på?

Eksemplet ovenfor dette til webtrends:

dcsdat=1465303397378
dcssip=bib.ballerup.dk
dcsuri=/search/ting/pilcher
dcsqry=?facets[]=facet.type%25253Afilm%252520(net)
WT.oss=pilcher
WT.oss_r=1
WT.tz=2
WT.bh=14
WT.ul=da
WT.cd=24
WT.sr=2560x1440
WT.jo=Yes
WT.ti=bib.ballerup.dk
WT.js=Yes
WT.jv=1.8
WT.ct=unknown
WT.bs=2560x854
WT.fv=Not%2520enabled
WT.slv=Unknown
WT.le=UTF-8
WT.tv=10.4.1
WT.dl=0
WT.ssl=1
WT.es=bib.ballerup.dk%252Fsearch%252Fting%252Fpilcher
WT.fb_js=0
WT.ce=2
WT.vt_f_tlh=1465303385
WT.vtvs=1465303329069
WT.vtid=a79b2746-ba8d-48b8-abc5-5474a92dd8d1
WT.co_f=a79b2746-ba8d-48b8-abc5-5474a92dd8d1

Søgning og resultat findes i de to linjer med WT.oss

I Firefox kan F12 benyttes for at se hvad der sendes - jeg har for (u)overskuelighedens skyld erstattet "&" med linjeskift

#4 Updated by Simon Holt over 3 years ago

Når jeg kigger i Webtrends, ser det ud som om den slet ikke tager højde for query-parametere i URL. Gætter da på at det er derfor den ikke kan kende forskel på en søgning med eller uden facetter, da de kommer på URL'en som query-parametre. Eller det burde den måske?

Jeg har et andet modul, der også benytter query-parameter i URL og her kan jeg heller ikke tracke noget nemlig.

Jeg er i gang med bedre løsning til onsite-search i anden sag #1732. Vi burde have oplysninger om hvilke facetter brugeren har valgt under generering af oss metatags. Så det jeg måske kunne gøre var at inkludere facetterne i søgestreng værdien på metatag'et efter en aller anden konvention.

#5 Updated by Simon Holt over 3 years ago

Fandt noget Webtrends dokumentation, der omtaler noget URL Parameter Analysis Settings:

https://help.webtrends.com/en/Analytics9Admin/cs_admin_urlparms_url_param_analysis_settings.html

#6 Updated by Steen Larsen over 3 years ago

Jeg tror faktisk det er den rigtige vej - at inkludere facetterne i søgestrengværdien.
Udtrykket der sendes til opensearch og som resulterer i X antal hits er jo netop en kombination af de forskellige facetter og det indtastede søgeudtryk (som dog er konverteret til CQL).

Eksempel:
https://bib.ballerup.dk/search/ting/krimi%20danmark?facets[]=facet.type%3Aebog&facets[]=facet.subject%3Ak%C3%B8benhavn&facets[]=facet.date%3A2016

Her skulle man så sende i én streng en kombination af
facet.type=ebog
facet.subject=købenbenhavn
facet.date=2016
krimi danmark

Skal rækkefølgen bevares?
Skal det være kommasepareret?
Eller skal det være den faktiske CQL-streng der sendes til opensearch?
Skal den brugte profil i opensearch også med? (enkel løsning kunne være at benytte den som prefix til hele udtrykket)

#7 Updated by Michael Anker over 3 years ago

Jeg skriver lige til KPI og beder dem om at kigge på det, da som Steen skriver faktisk ser ud til at facetterne bliver sendt til Webtrends, om det så bliver smidt af et sted i processen må de jo lige kigge på.

Jeg er også stor fortaler i at parametrene står i URLen da vi så kan sende dem til lånerne når vi hjælper dem.

Hvis bare siden optræder i sideoversigten, så kan vi altid lave søgninger i webtrends og lave simple optællinger på hvor meget en facet bliver brugt.

#8 Updated by Simon Holt over 3 years ago

> Jeg er også stor fortaler i at parametrene står i URLen da vi så kan sende dem til lånerne når vi hjælper dem.

Ja de skal være en del af URL'en. Ellers vil caching ikke virke. Det er bare et problem at de er en del af query-parameter delen af URL'en (det der kommer efter '?').

Efter at have læst lidt dokumentation, ser det ud som om, at man specifikt skal definere hvilke query-parameters der trackes (se mit link i ovenstående). Det er måske lavet sådan, fordi Webtrends anvender query-parametre selv til noget af funktionaliteten og man vil ikke have de skal dukke op i statistikken. Det er mit gæt.

Men som Steen og jeg har snakkede om i oventstående, vil jeg se om jeg kan få dem med alligevel i det andet issue. Jeg vil faktisk sige, at det er den bedste løsning hvis det kan laves sådan, da det jo som Steen også skriver er sådan de bliver sendt til brønden.

#9 Updated by Michael Anker over 3 years ago

Ellers kan det jo være at KPI kan konfigurere det centralt, da vi så er fri for at lave noget kode i DDB CMS. Der bør være en måde man kan sige til Webtrends at bestemte query-parametre skal med i statistikken.

Vi får at se hvad de siger. Har lige skrevet til dem og de plejer at svare hurtigt :-)

#10 Updated by Simon Holt over 3 years ago

Ja så kan vi tracke brugen af facetter ved at kigge på side-hits med facet-query parametre.

Sådan som jeg har tænkt at lave det, bliver facetterne indsat direkte i Onsite Search statistikken. Så der er også forskel der.

EDIT: Så foreslår vi gør begge ting :)

#11 Updated by Michael Anker over 3 years ago

KPI har lige meldt tilbage at de prøver at oprette en ekstra Ballerup-profil, hvor de konfigurerer så alle Webtrends parametre ekskluderes, når data analyseres. De afprøver i næste uge og så ser vi hvad der sker.

Det bliver så fedt at kunne se hvilke facetter der bliver brugt :-)

#12 Updated by Simon Holt over 3 years ago

Så der PR der appender brugerens valgte facetter til søgestrengen, nøjagtig ligesom Ting search gør det for at reflektere den endelige query, der sendes til opensearch:

https://github.com/ding2/ding2/pull/253

Vil gerne lige understrege, at dette er ikke det samme som at tracke query-paramter, som Michael er i dialog med KPI i om i ovenstående. Det her indsætter facetterne direkte i onsite search statistikken, så det er muligt at differentiere søgning med/uden bruger valgte facetter.

Note: Havde overvejet bare at indsætte den endelige query der sende til opensearch, men denne kan indeholde urelevante ting som f.eks. holdingsitem.agencyid.

#13 Updated by Rolf Madsen over 3 years ago

  • Status changed from Needs analysis to Needs code review
  • Assignee set to Gitte Barlach

#14 Updated by Michael Anker over 3 years ago

Jeg har lige fået tilbagemelding fra KPI og de har fjernet indstillingen som fjerner alt i søgestrengen i en Ballerup profil de har oprettet. Altså den indstilling der fjerner alt det efter spørgsmålstegnet i URLen.
Hvilket vil sige at en søgning på Pilcher med filtrering på Lydbog (CD) og emnet kærlighed bliver barberet ned til
https://bib.ballerup.dk/search/ting/pilcher

hvor URLen i virkeligheden ser sådan her ud
https://bib.ballerup.dk/search/ting/pilcher?facets[]=facet.type%3Alydbog%20%28cd%29&facets[]=facet.subject%3Ak%C3%A6rlighed

KPI har afprøvet den nye ændring i profilen Ballerup (parameter)
I kan se den inde i Webtrends ved at finde profilen, så gå ned til Content - Pages og søge efter Facets. Tror i kan bruge dette link
https://analytics.webtrends.com/analytics/spaces/141420/profiles/100869/reports/oOEWQj3sUo6#%7B%22report%22%3A%7B%22displayLength%22%3A100%2C%22displayStart%22%3A0%2C%22filter%22%3A%22facets%22%2C%22fullScreen%22%3Atrue%2C%22showChart%22%3Atrue%2C%22sortcol%22%3A1%2C%22sortdir%22%3A%22desc%22%2C%22updateServer%22%3Atrue%2C%22viewMode%22%3A%22heat%22%7D%2C%22report-oOEWQj3sUo6%22%3A%5B%5D%7D

Jeg er lidt i tvivl om Simons PR er nødvendig?
Under alle omstændigheder er det smart at få det ændret i KPI, da vi skal bruge URLerne til scenarie analyse og andre lækre ting :-)

Jeg har skrevet til KPI om det er nemt at implementere for alle profiler, men det er i sidste ende DDB der skal tage beslutningen samt melde den glædelige nyhed til alle at man nu kan se facetter. Man kunne også overveje at lave nogen udtræk til indekset om anvendelsen af facetterne, da det vil være lidt møjsommeligt at lave optællinger på brugen af de forskellige facetter.

Men virkelig fedt at kunne begynde at granske lidt i brugen af facetter :-)

#15 Updated by Gitte Barlach over 3 years ago

  • Assignee changed from Gitte Barlach to Jesper Kristensen

#16 Updated by Simon Holt over 3 years ago

@Michael

Hvis du kigger på On-Site Searches statistikken under Content i Webtrends anaylytics, så vil du se at søgestrengene ikke indeholder facetter brugeren har valgt i UI. Disse kommer ikke ved at tracke query-parameters, men kommer derimod fra værdien af WT.oss metatag'et. Det er i denne værdi, mit PR indsætter facetterne.

Men det vil være fint også samtidig at tracke query-parametre, da de også kan blive brugt til andre ting. Vi vil kunne se søgesider med facet parametre og dermed også af den vej se hvordan brugerne bruger facetterne. Desuden vil vi også kunne se hvor langt brugerne bladre i søgeresultatet, da paginereingen også benytter query-parameters.

#17 Updated by Jesper Kristensen over 3 years ago

  • Status changed from Needs code review to Reviewed - Needs info/rework
  • Assignee changed from Jesper Kristensen to Simon Holt

@GBA i skal find ud af om det skal med eller det er web-trends der ikke gør det rigtig.

Reviewed med en enkelt kommentar.

#18 Updated by Michael Anker over 3 years ago

@Simon

Ja det er rigtigt at brugen af facetter, sortering, antal søgeresultat og paginering ikke kommer ind i søgetermsoversigten, men det var heller ikke hensigten med issuen. Det var at de skulle vises i pages oversigten, så vi også kunne bruge det i den scenarie analyse #1748 som vi har ønsket, da vi så sporer alle hændelser i søgningen som beskrevet i red route for søgning http://platform.dandigbib.org/projects/ddb-cms/wiki/PrioritizingIssues#Funktionsområdet-Søgning

Jeg har snakket med DDB (Rolf) om vi ikke skulle lave et specielt udtræk til Danmarks Biblioteksindex som vi f.eks. gør på søgetermer
http://danmarksbiblioteksindex.dk/NationalKeywords.aspx
Det ser ud til de ønsker det.

Jeg kunne være bange for at hvis du populerer søgetermsoversigten med alle afgrænsningsmulighederne så vil f.eks. en søgeterm blive splittet op i mange forskellige linier, hvor den kun er en for hver søgeterm i dag. Det vil sige at søgetermen Sara Blædel vil stå mange forskellige steder f.eks. vil der være en linie for alle dem der har klikket på side 2, side 3, side 3 etc. og så en for alle dem hvor de har brugt materialetype bog. Det betyder at vi ikke vil have en samlet oversigt over Sara Blædel søgninger.

Hvis vi starter med en specielt udtræk på hvor mange søgninger har vi hvor man klikker på side 2, side 3 etc. Hvor mange der bruger de forskellige facetter, så vil det være en meget god indikation af brugen af dem. Jeg håber så at scenarie analysen bruges til de lidt mere dybdegående analyser hvor jeg tror vi vil kunne se at der er forskellig brug af facetter ved verifikative og eksplorative søgninger. Man kunne også gætte at på de verifikative søgninger bruger man ikke pagineringen så meget som ved eksplorative søgninger. Hvis jeg laver en søgning på sider hvor man har bladet til side 7 så er det typisk søgninger vi har lavet til brugerne over alle vores nye krimier etc.

#19 Updated by Simon Holt over 3 years ago

Sortering og paginering skal selvfølgelig ikke ind i søgetermsoversigten. Det påvirker jo ikke antallet af resultater. Mit argument for at inkludere facetterne i søgetermsoversigten er, at det er en anden søgning der foretages og at det påvirker det antal vi sender videre til Webtrends.

#20 Updated by Simon Holt over 3 years ago

PR er opdateret.

Hvis I vælger ikke at tage denne med, så husk lige PR'et fra #1732, der fikser bug'en med at man kan ødelægge søgestatistikken med en forkert oversættelse.

#21 Updated by Michael Anker over 3 years ago

@Simon

Det er klart det påvirker søgningen, men jeg synes lidt det kommer til at ødelægge oversigten.

Vi kan se på vores nyoprettede profil at det ville dele søgetermen Sara Blædel op i
facet.type:bog
facet.date:2016
facet.creator:sara blædel
facet.subject:krimi
facet.type:bog&facets[]=facet.subject:krimi

og så en ren søgning på Sara Blædel

det er hvis jeg lige hurtigt kigger på det, så det vil betyde at det bliver meget sværere at reagere på hvad folk er interesseret i, fordi Sara Blædel søgetermen vil stå rigtig mange steder i søgeoversigten.

Jeg synes søgetermsoversigten skal vise hvilke søgetermer folk bruger, så skal vi også vide hvilke variationer man bruger med sortering og facetter men det tror jeg er bedre egnet i et specialudtræk.

Så for at opsummere er jeg ikke sikker på jeg synes det er en god ide at medtage den Pull Request, men det er selvfølgelig op til DDB.

Måske man skulle oprette en seperat sag på denne, da det er relateret men ikke så meget med at vi skal have den med i sideoversigten.

#22 Updated by Gitte Barlach about 3 years ago

  • Status changed from Reviewed - Needs info/rework to Need more info
  • Assignee changed from Simon Holt to Rolf Madsen

Hej Rolf
Skal denne med i sin nuværende form eller skal vi i tænkeboks igen?

#23 Updated by Rolf Madsen about 3 years ago

#1731 afklares og tages med i en senere release.

Nærmere forklaring fremgår af http://platform.dandigbib.org/issues/1732#note-15

#24 Updated by Gitte Barlach about 3 years ago

  • Target version changed from DDB CMS 2016 2. opgradering to DDB CMS 2017 1. opgradering (7.x-4.0.2)

#25 Updated by Rolf Madsen about 3 years ago

  • Target version changed from DDB CMS 2017 1. opgradering (7.x-4.0.2) to DDB CMS 2017 1. opgradering (DBC sprintbacklog)

#26 Updated by Rolf Madsen almost 3 years ago

  • Status changed from Need more info to Needs analysis
  • Target version changed from DDB CMS 2017 1. opgradering (DBC sprintbacklog) to Release 27 - Bugfixes (2017 2. opgradering) (7.x-4.2.1)

#27 Updated by Rolf Madsen over 2 years ago

  • Assignee changed from Rolf Madsen to Simon Holt

Hej Simon

Jeg skriver i http://platform.dandigbib.org/issues/1732#note-15 at "Simon skal lave et nyt PR for #1731, som kun indeholder rettelserne til statistik for facetterne.".

Det er en lettere bombastisk udmelding, som jeg ikke mindes om jeg har afklaret med dig, hvilket jeg gerne vil undskylde hvis det ikke var tilfældet!

Kan du i alle tilfælde bekræfte eller afkræfte at vi pt. ikke har en løsning på statistik på facetterne?

#28 Updated by Simon Holt over 2 years ago

Hej Rolf

Lige for at opsummere: Problematikken er at webtrends som default ikke tracker query-parameters. Det skal man indstille under "Administration > Web Analysis > Report Configuration > URL Parameters" i Webtrends, som vi ikke har adgang til. Mere info: https://help.webtrends.com/en/Analytics9Admin/cs_admin_urlparms_url_param_analysis_settings.html

Da brugervalgte facetter bliver tilføjet som query-parameters, bliver disse ikke tracket i vores webtrends.

Der var 2 løsninger i spil

1. Få KPI til at tracke query-parametre. Dette bevirker at man f.eks. under "Site pages" i webtrends kan søge på "facets[]=" og dermed få vist alle sider med brugervalgte facetter. Dette er blevet sat op for Ballerup i en speciel profil "Ballerup (parametre)". Hvornår det bliver tilgængelig for resten af bibliotekerne fremgår ikke nogen steder i sagen.

2. Indsæt de brugervalgte facetter direkte i søgestrengen der sendes til webtrends. Dette vil bevirke at man under "On-site Searches" statistikken kan se brugervalgte facetter dirkete. Mit PR #note-12 gør dette, men er ikke blevet merget.

Steen skriver om løsning 2. dette (#note-6):
>Jeg tror faktisk det er den rigtige vej - at inkludere facetterne i søgestrengværdien.
>Udtrykket der sendes til opensearch og som resulterer i X antal hits er jo netop en kombination af de forskellige facetter og det indtastede søgeudtryk (som dog er konverteret til CQL).

Men Michael Anker havde følgende bekymring om løsning 2 (#note-18):
>Jeg kunne være bange for at hvis du populerer søgetermsoversigten med alle afgrænsningsmulighederne så vil f.eks. en søgeterm blive splittet op i mange forskellige linier, hvor den kun er en for hver søgeterm i dag. Det vil sige at søgetermen Sara Blædel vil stå mange forskellige steder f.eks. vil der være en linie for alle dem der har klikket på side 2, side 3, side 3 etc. og så en for alle dem hvor de har brugt materialetype bog. Det betyder at vi ikke vil have en samlet oversigt over Sara Blædel søgninger.

og

>Jeg synes søgetermsoversigten skal vise hvilke søgetermer folk bruger, så skal vi også vide hvilke variationer man bruger med sortering og facetter men det tror jeg er bedre egnet i et specialudtræk.

Jeg synes begge løsninger fint kunne fungere ved siden af hinanden og er ikke helt enig med Michael. Er enig at ting som sortering er urelevant i søgestatistikken, men mener at de brugervalgte facetter er noget andet og bør fremgå i den.

#29 Updated by Rolf Madsen over 2 years ago

Er Michel og Steen enige i den opsummering?

#30 Updated by Michael Anker over 2 years ago

Jeg er enig i opsummering, men synes stadig at løsning 2 ikke er hensigtsmæssig.

Vi har lige fået en introduktion til Webtrends Infinity, hvor jeg tror vi vil kunne opnå samme slutresultat som løsning 2, men uden at implementere løsning 2. Det gør at søgetermsoversigten er mere overskuelig, og så kan man grave ned i data hvis man har brug for det.

Infinity løsningen kan tabulere på mange flere forskellige parametre, så jeg ville implementere løsning 1, og så se om den kommende Infinity-løsning ikke dækker vores behov for at kunne granske i søgedata i højere grad.

KPI skulle være i dialog med DDB eller omvendt om implementeringen af Infinity.

#31 Updated by Simon Holt over 2 years ago

Jeg synes bare det giver et misvisende billede af, hvad der bliver søgt på og hvor mange gange der er blevet søgt på en specifik term, hvis vi ikke implementere løsning 2.

Hvis en bruger f.ek.s søger på `resident evil` og herefter afgrænser til `playstation 4` i materialetype, så vil det på nuværende tidspunkt give 2 hits til `resident evil` i statistikken. Så det ser ud som om, der er blevet søgt to gange på `resident evil`. De to søgninger der i virkeligheden er blevet foretager er `resident evil` og herefter `resident and facet.type="playstation 4"`. Jeg mener det er meget forkert, hvis den 2. søgning også tæller som en søgning på `resident evil`.

#32 Updated by Rolf Madsen almost 2 years ago

  • Description updated (diff)
  • Priority changed from Normal to None

#33 Updated by Rolf Madsen almost 2 years ago

  • Status changed from Needs analysis to Closed

Dette udviklingsønske tages med i de generelle overvejelser omkring udviklingen af Webtrekk og dette issue lukkes derfor i dette regi. 

Also available in: Atom PDF