[SLD] Web scraping dynamical pages with R

Bilo je i večih problema, pa ih nismo riješili. Grunf

Kako prebrati podatke iz tabele na dinamični strani Ko “rvest” ne deluje! Dinamične strani se generirajo šele, ko se naložijo v “browser”, pred tem pa določeni elementi na njih ne obstajajo. Običajno so rezultat jscript funkcije. S takšnih strani običajno ni možno brati tabel s pomočjo Rvest paketa (ali česa podobnega). Obvod je s pomočjo paketa RSelenium (Selenium v pythonu).

[SLD] Power BI malenkosti

Technology is a word that describes something that doesn’t work yet. Douglas Adams It’s supposed to be automatic, but actually you have to push this button. John Brunner

Power BI: Pot do podatkov Neugodno je, ker Power BI ne pozna relativnih poti (npr. ./A/Podatki.xls). Primer: izbereš podatke, ki so v excelovi tabeli v mapi A (C:\A\Podatki.xls) in potem premakneš ali preimenuješ mapo A. S tem avtomatsko izgubiš povezavo s podatki in moraš v naprednem urejevalniku popraviti pot do podatkov.

[SLD] KPI indicator Design

Manj kot govoriš, bolj ti prisluhnejo. Pauline Philips

To je v angleščini. Brez kode sem objavil na LinkedIN Implementing a good key process indicator (KPI) is difficult but maintaining it is even harder. Fortunately designing the indicator is much easier. To see this all in one picture, I suggest following design of KPI indicator: KPI indicator, like gauge or box plot or … TREND indicator, like arrow or simple text (“trend positive”) or value before - now … If possible also prediction.

[SLD] ab uno disce omnes »po enem spoznaj vse«

It’s simple, but simple isn’t the same as easy Old Man’s War (John Scalzi)

Tukaj sem nametal nekaj skriptov, za katere se mi zdi, da jih bom še potreboval. RMD narediš lahko malo lepši s pomočjo teh navodil Črtna koda iz PDF Za čitanje PDF uporabim poppler (http://blog.alivate.com.au/poppler-windows/) Črtno kodo čitam s pomočjo knjižnice ZBAR (https://sourceforge.net/projects/zbar/files/zbar/0.10/zbar-0.10-setup.exe/download). S pip install pyzbar si namestiš pythonov vmesnik.

Deluje nekako tako:

[SLD] PDF OCR

“Quod licet iovi,non licet bovi.” Bogovom je dovoljeno več kot govedu. Publius Terentius Afer

Algoritem

Skeniraj več PDF strani v en dokument (skener nima vgrajenega OCR). Včitaj shranjen PDF. Na vsaki strani je na določeni lokaciji shranjeno ime. Prečitaj to ime z OCR in shrani stran kot nov PDF s tem imenom.

kodo kličeš z:

retVal = fPdfOcr2(self.sFile, DatumF=DatumF, d1_w=0.8739, d1_h=0.2583, d2_w=0.9303, d2_h=0.3897, saveImg=False) if (retVal == True): #tk.