Automatizce ve fyzice: Open data, F.A.I.R.
Připojte se
cermak.science/teaching/automation/lectures/12-fair/presentation.html
Úvod
Co je F.A.I.R.?
- T jako Trustworthy
- data nejsou upravena
- metadata jsou v pořádku (automatické vyplnění)
- všechna data jsou publikována
Findable
- Chceme vědět, jestli někdo ještě měřil fonony v křemíku
- Článek
- Findable?
. . .
Accessible
- definovaný přístup (API)
- porovnejte:
- –> strojově čitelný záznam
Interoperable
- použití standardizovaného formátu dat (někde je popis)
- parametry experimentu v metadatech
- lze využít ufit library (pip install ufit)
Reusable
idea: skript zpracuje všechna data do článku
nestačí pouhý Jupyter notebook
vytvořit
requirements.txt
se specifikovanou verzí knihovenbinder:
nebo:
- použít Repo2Docker
- archivovat celý docker image
Ideální stav
Cvičení - zpracujeme si data
Publikace dat
- python knihovna
ufit
- cviceni.py
Generování dockeru
- Nainstalovat docker (použít WSL na windows)
pip install jupyter-repo2docker
- generování repositáře
jupyter-repo2docker https://github.com/xxx/yyy
# nebo
jupyter-repo2docker lokalni/adresar
. . .
Spouštění
docker load < silicon.tar.gz
docker run -it -p 8888:8888 silicon jupyter notebook --ip 0.0.0.0