Annons
X
Annons
X

Utvecklingsbloggen

Ola Henriksson

Ola Henriksson

I sommar gjorde vi ett test med en ljudbok som man kunde ladda ner helt fritt från SvD.se. Boken fanns tillgänglig från den 29 juni till den 13 juli. Några kapitel lades ut varje dag och man kunde prenumerera på avsnitten direkt till ex iTunes eller Doppler. Boken var Erik Erikssons De svarta molnens tid, utgiven på Ordupplaget. Boken behandlar en ganska dold del av Sveriges neutralitetspolitik under andra världskriget, nämligen tyska transporter till Finland genom svenskt vatten.

Nu när vi är klara med sommarboken ska jag sammanfatta lite hur det gick. Sidorna för sommarboken har haft cirka 11 000 besökare. Podcast-feeden distribuerades via Feedburner och eftersom jag är ny användare av den tjänsten är jag lite osäker på hur jag ska tolka siffrorna. Klart är att det inte är jättemånga som prenumererat på filerna via podcast, knappt ett hundratal. 61 procent har använt iTunes, ungefär lika många på mac som pc. Google reader kommer på andra plats.

Att så många besökt sajten och så få prenumererat på feeden tolkar jag som att den stora majoriteten lyssnat direkt via webben eller laddat hem filerna därifrån.

Allt gick inte helt smärtfritt. Vi hade problem med servern som filerna skulle hämtas från. Av någon anledning verkade laddningen avbrytas om det tog för lång tid att hämta hem filerna. Det var inte jättetunga filer, ca 10-20 MB, men de som satt på en långsam uppkoppling kunde inte ladda hem kompletta kapitel. Jag la ut filerna på en alternativ server också, som verkade fungera bättre.

Dessutom visade det sig mot slutet av boken att sektionssidan där jag publicerade kapitel för kapitel bara kunde hantera cirka 50 poster. Och när vi kom mot slutet försvann de först publicerade kapitlen från sajten. En hel del arga kommentarer och mejl vittnar om detta.

Lärdomarna är: Ju större efterfrågan desto viktigare är det att allt fungerar. Att leverera en tjänst som inte lever upp till förväntningarna irriterar och skapar dåligt rykte. I detta fall kunde jag enkelt svara alla som mejlade och när vi kan hjälpa vänds genast sura miner till tacksamma tillrop.

Tack till Ordupplaget som gav oss möjligheten. Gillade du boken eller har önskemål om vi ska göra om det, gå in på SvD.se/sommarboken och tyck till, eller lämna din kommentar här på bloggen.

Ola Henriksson

”Jag visste inte att jag var så duktig på detta.” Henrik Ståhl, webbredaktör på SvD.se är uppriktigt förvånad när han får veta att han är en fena på sökmotoroptimering. Helt ovetande har hans artikel om Lociloci granskats av bloggaren Nikke Lindqvist. Trots att bloggaren Dan Nilsson var före med nyheten och som aktiv bloggare har full koll på hur man ska skriva för Google leder SvD.se när man söker på Google. Vem som vinner i längden återstår att se.

Sökmotorn Googles tekniker gör allt de kan för att du ska få så releventa träffar som möjligt när du söker på nätet. Att du så ofta hittar vad du söker efter beror på att tekniken ständigt förfinas. För det är ren matematik som avgör vilket ordning sökträffarna presenteras i. Ingen mänsklig bedömning finns bakom. Samma kunskap försöker webbredaktörer och tekniker världen över utnyttja för att just deras sidor ska hamna högt i sökresultatet. Det är detta som kallas sökmotoroptimering, eller med en förkortning av det engelska search engine optimization – SEO.

Exemplet med Lociloci-artikeln är ett tydligt bevis på hur sökmotoroptimering fungerar i praktiken. Att vår artikel rankar så högt utan att vi egentligen jobbat för det har tre tydliga orsaker:

– Grunden för journalistiskt skrivande, dvs gå rakt på nyheten, börja med det viktigaste först etc. gör att artiklarna nästan av sig själv uppfyller kraven.

– Vårt cms är anpassat så att det uppfyller grundkraven för Googles sökalgoritmer. Vi har dessutom jobbat hårt under förra året för att anpassa de delar av sajten som hade brister.

– Henrik Ståhl har drillats av sin tidigare arbetsgivare att använda nyckelord i rubriker och ingresser.

Vi är ännu inte nöjda. I augusti har vi planerat ett seminarium tillsammans med Klikki, vår samarbetspartner vad gäller SEO-arbetet. Då ska alla redaktörer lära sig ännu mer om hur man skriver artiklar som enkelt kan hittas via Google-sök. Och vi är angelägna att ranka högt, för trafiken från Google och andra sökmotorer står för en ansenlig del. SvD.se får mellan 15 och 25 procent (beroende på mätverktyg) av trafiken direkt från sökmotorerna.

Ola Henriksson

Som du ser har vi i veckan gjort om vår sökfunktion. Har du inte märkt det gör det egentligen inget. Tanken var att så smärtfritt som möjligt byta från en tidigare leverantör (Sesam) till ett egenutvecklat system.

För oss som jobbar bakom kulisserna har det varit ett stort och omfattande arbete, gjort under tydlig tidspress. Sesam skulle stänga sin söktjänst kl 24 den 30 juni, kl 12.43 samma dag bytte vi. Det vi lanserade är i princip exakt samma tjänst som vi fick via Sesam. Några saker återstår att färdigställa, och det har Fredric Karén redogjort för här.

Men framför allt innebär den nya sökfunktionen två stora fördelar:

1) Vi kapar kostnader. Sesam byggde på sökmotor Fast, som har riktigt höga licenskostnader.

2) Vi tar kommandot över vidareutvecklingen. Förhoppningsvis kommer läsarna upptäcka flera spännande funktioner som vi kan bygga ovanpå den nya sökmotorn. Daniel Halldin, systemutvecklare, som gjort hästjobbet med att utveckla söket under kort tidspress, utvecklar några idéer nedan.

Daniel Halldin, systemutvecklare på SvD, får här själv svara på vad han egentligen gjort?

– Jag har byggt ”extractors” som bevakar Escenic och hämtar ut information om artikeltyper och sektioner. Så fort en ändring sparats indexeras förändringen. Förändringar i en artikel tar bara någon minut innan de syns i söklistningen. Jag har byggt hela söksidan med presentation av resultatet. Jag har också gjort en export från vår blogg som enkelt borde gå att anpassa till andra typer av externa flöden. Sen har jag försökt minimera lasten på våra servrar. Ramverket och sökfrågorna cacheas för att förhindra överbelastning om många söker på samma begrepp.

Vad är det för teknik bakom?

Solr är själva sökmotorn som håller indexet och levrerar söksvar till klienterna (våra respektive söktjänster). Bygger på sökbiblioteket Lucene.

– Solrj, javaclient för att förenkla kommunikationen som skickas mellan klienter och server.

– I övrigt samma som vi redan innan använder Maven, Subversion (det nya är att vi hämtar kod från Aftonbladet). Vi kör vår sökmotor i Escenic-installationen, på alla våra webbfrontar.

Hur är det att jobba med Solr?

– Jag hade mycket liten erfarenhet av att jobba med sökmotorer. Spontant tycker jag att den har varit relativt smidig att jobba med. Den är enkel att installera, är flexibel och det finns många hjälpmedel runt omkring som det brukar med ”open source”-applikationer, bristfälligt dokumenterade dock. Allt hittills tyder på en bra prestanda.

Vilka delar görs tillsammans med Aftonbladet och hur fungerar det?

– Vi använder samma Solr-servrar, men separata index. Kodbasen för indexeraren är utvecklad av Aftonbladet och ligger i deras repository. Den laddas över och slås samman med vår specifika kod (våra extractors) när man bygger den.

Hur många timmars utveckling har du lagt ner?

– Ungefär en månad heltidsarbete. Sedan har vår systemutvecklare lagt Martin Andersson lagt ner några dagar också, bland annat på front end-utveckling.

Vad har varit den svåraste utmaningen?

– Den korta tid tills vi var tvungna att lansera. Det är också en stor utmaning att jobba med dynamiskt genrerade sidor på välbesökta siter. Det gäller att fundera ut hur man kan bygga den så den tar så lite kraft av servrarna som möjligt och cachea så mycket som möjligt, på olika nivåer. Dessutom att bygga en prestandamässigt bra söktjänst och att sätta sig in i och förstå Solr och Solrj.

Vad kan man mer göra, vad återstår på utvecklingslistan?

– Exportera data från, och indexera: bloggar och quizzar.

– Hantera viktade sökningar, ex direktträff på specifikt index.

– Skapa autolistningar (med xslt eller jquery) på andra delar av siten, ex senaste filmrecensionerna med betyg 6, senast skrivet av författare X, senaste researtiklarna etc…

– Geografiska sökningar.

– Bild- och videosök.

– Ett smidigare gränssnitt för filtrering

– Testa att jobba med jquery-stödet som finns, minisökningar i högerspalten?

– Testa andra sökalgoritmer för att se vilket som levererar bäst träffar.

Något övrigt att tillägga?

– Jag är mycket nöjd med vad vi hunnit åstadkomma på så kort tid. Det är en bit kvar till det Sesam hade, men nu har vi kontroll över koden själva och kan vidareutveckla den och använda den till mycket mer än en sökmotor.

De som driver utvecklingen är användarna och därför är det jätteviktigt med era synpunkter. Enkelheten och träffsäkerheten hos Google sätter ribban för vad vi måste leverera till våra besökare. Den tjänst vi har idag har utvecklats tillsammans med Sesam under flera år och det är alltid lättare att jobba vidare om man har en bra grund att stå på.