Home About Browse Search

Data integration and handling

building an informatics platform for research integrated biobanks

Klingström, Tomas (2017). Data integration and handling. Diss. (sammanfattning/summary) Uppsala : Sveriges lantbruksuniv., Acta Universitatis agriculturae Sueciae, 1652-6880 ; 2017:99
ISBN 978-91-7760-088-6
eISBN 978-91-7760-089-3
[Doctoral thesis]



Modern technology allows researchers to generate data at an ever increasing rate,
outpacing the capacity of researchers to analyse it. Developing automated support
systems for the collection, management and distribution of information is therefore an
important step to reduce error rates and accelerate progress to enable high-quality
research based on big data volumes. This thesis encompasses five articles, describing
strategies for the creation of technical research platforms, as well as descriptions of the
technical platforms themselves.
The key conclusion of the thesis is that technical solutions for many issues have been
available for a long time. These technical solutions are however overlooked, or simply
ignored, if they fail to recognise the social dimensions of the issues they try to solve.
The Molecular Methods database is an example of a technically sound but only
partially successful solution in regards to social viability. Thousands of researchers
have used the website to access protocols, but only a handful have shared their own
work on MolMeth. Experiences from the Molecular Methods database and other
projects have provided a foundation for studies supporting the development of the
The eB3Kit is a portable, robust and scalable informatics platform for structured data
management. Deploying the platform enables research groups to carry out advanced
research projects with very limited means. With the eB3Kit researchers can integrate
data from a wide variety of sources, including the local laboratory information
management system and analyse it using the Galaksio interface. Galaksio provides user
friendly access to the Galaxy workflow management system and provides eB3Kit users
with access to tools developed by a far larger user community than the one actively
developing the eB3Kit. Using a workflow management system improves
reproducibility and enables bioinformaticians to prepare workflows without directly
accessing ethically or commercially sensitive data. Therefore, it is especially well-
suited for applications where researchers are worried about privacy and during disease
outbreaks where persistent storage and analysis capacity must be established quickly.

Authors/Creators:Klingström, Tomas
Title:Data integration and handling
Subtitle:building an informatics platform for research integrated biobanks
Alternative abstract:

Modern teknik gör det möjligt att generera mer data från experiment än någonsin tidigare. Inom livsvetenskaperna har denna utveckling gått så fort att forskare ofta
genererar mer data än de klarar av att analysera. Det är därför viktigt att utveckla automatiserade stödsystem för provinsamling, informationshantering och dataöverföring för att forskare bättre ska kunna hantera stora datamängder. Denna avhandling omfattar fem delarbeten som beskriver strategier för att bygga tekniska informationsplattformar och två exempel på sådana plattformar.
Den övergripande slutsatsen är att tekniska lösningar för många problem har funnits länge. Däremot har dessa lösningar ofta inte applicerats i praktiken då de varit fokuserade på tekniska aspekter utan att hantera de sociala dimensionerna som styr forskningen. The Molecular Methods database är ett sådant exempel. Tusentals forskare har använt hemsidan för att hitta laboratorieprotokoll men endast ett fåtal har valt att själva bidra med protokoll till hemsidan. Erfarenheterna från detta arbete och andra projekt har därefter legat till grund för studier till stöd för utvecklingen av eB3Kit inom
ramen för B3Africa-projektet.
eB3Kit är en portabel, robust och skalbar plattform för strukturerad hantering av data. Genom att använda plattformen kan forskargrupper genomföra omfattande
forskningsprojekt med väldigt begränsade resurser. Plattformen gör det möjligt att integrera data från många olika källor och analysera dessa med hjälp av Galaksio.
Galaksio är ett användargränssnitt utvecklat för att skapa en mer användarvänlig miljö vid hanteringen av bioinformatiska arbetsflöden. Gränssnittet är direkt kopplat till Galaxy workflow management system och innebär att forskare kan dra nytta av arbetsflöden utvecklade av långt fler forskare än de som använder eB3Kit. Genom att
använda Galaxy ökar spårbarheten inom dataanalys och det är även möjligt för bioinformatiker att förbereda analysflöden utan att själva komma i kontakt med etiskt eller kommersiellt känsliga data. eB3Kit är därför väl lämpat för situationer där forskare behöver kunna ha kontroll över känsliga data eller snabbt etablera en provsamsamling och analysera data vid exempelvis sjukdomsutbrott.

Series/Journal:Acta Universitatis agriculturae Sueciae (1652-6880)
Year of publishing :27 October 2017
Depositing date:30 October 2017
Number of Pages:111
IKlingström T., Soldatova L., Stevens R., Roos T.E., Swertz M.A., Müller K.M.Kalas., Lambrix P., Taussig M.J., Litton J.E., Landegren U., Bongcam-Rudloff E. (2013). Workshop on laboratory protocol standards for the molecular methods database. New biotechnology, 30(2), 109-113 .
IIScholarly publication in the digital age, an investigation into why novel publishing concepts have failed to disrupt the market of scientific journals. Klingström T., Regierer B., Attwood T.K., Bongcam-Rudloff E. Manuscript.*
IIIKlingström T., Bongcam-Rudloff E., & Reichel J.. (2017). Legal & ethical compliance when sharing biospecimen. Briefings in Functional Genomics, elx008.*
IVKlingstrom, T., Mendy, M., Meunier, D., Berger, A., Reichel, J., Christoffels, A., Bendou H., Swanepoel C., Smit L., Mckellar-Basset,. & Bongcam-Rudloff, E. (2016). Supporting the Development of Biobanks in Low and Medium Income Countries. In IST-Africa Week Conference, MAY 11-13, 2016, Durban, SOUTH AFRICA.*
VKlingström T., Hernandez de Diego R., Collard T., Bongcam-Rudloff E. (2017). Galaksio, a user friendly workflow-centric front end for Galaxy. EMBnet.Mournal. In press*
Place of Publication:Uppsala
Publisher:Department of Animal Breeding and Genetics, Swedish University of Agricultural Sciences
ISBN for printed version:978-91-7760-088-6
ISBN for electronic version:978-91-7760-089-3
Additional Information:Copyright and restrictions: Paper I is published without specific permission in accordance with the Elsevier author rights. The original article is accessible at: https://doi.org/10.1016/j.nbt.2012.05.019. Paper II is the authors own manuscript. Paper III is an open access article distributed under the terms of the Creative Commons CC BY license, which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited. The original article is accessible at: https://doi.org/10.1093/bfgp/elx008 Paper IV © 2016 IEEE. Reprinted, with permission, from Klingström et. al., Supporting the development of biobanks in low and medium income countries, IST-Africa Week Conference, 2016. The original article is accessible at: https://doi.org/10.1109/ISTAFRICA.2016.7530672 Paper V is licensed under a Creative Commons Attribution 3.0 License. Funding: This work was financed by BBMRI.se, the BBMRI-LPC and the B3Africa projects. BBMRI-LPC is supported by the European Community’s 7th Framework Programme (FP7/20072013) grant agreement no. 313010, B3Africa is supported by the European Union s Horizon 2020 research and innovation programme under grant agreement No 654404. BBMRI.se acknowledges the Swedish Research Council grant agreement no. 829-2009-6285.
Publication Type:Doctoral thesis
Full Text Status:Public
Subjects:(A) Swedish standard research categories 2011 > 1 Natural sciences > 102 Computer and Information Science > 10203 Bioinformatics (Computational Biology) (applications to be 10610)
(A) Swedish standard research categories 2011 > 1 Natural sciences > 106 Biological Sciences (Medical to be 3 and Agricultural to be 4) > Bioinformatics and Systems Biology (methods development to be 10203)
(A) Swedish standard research categories 2011 > 3 Medical and Health Sciences > 304 Medical Biotechnology > Biomedical Laboratory Science/Technology
(A) Swedish standard research categories 2011 > 4 Agricultural Sciences > 403 Veterinary Science > Medical Bioscience
Agrovoc terms:bioinformatics, genetics, ethics
Keywords:bioinformatics, biobank, scholarly communication, ethics, genetics, galaxy, galaksio, the Molecular Methods database
Permanent URL:
ID Code:14669
Faculty:V - Veterinärmedicinsk fakultet (t.o.m. 2003)
Department:(VH) > Dept. of Animal Breeding and Genetics
Deposited By: Tomas Klingström
Deposited On:30 Oct 2017 12:45
Metadata Last Modified:30 Oct 2017 21:45

Repository Staff Only: item control page


Downloads per year (since September 2012)

View more statistics