calibcant/discussion.tex: Fill in section on data archival
authorW. Trevor King <wking@tremily.us>
Sun, 5 May 2013 19:55:58 +0000 (15:55 -0400)
committerW. Trevor King <wking@tremily.us>
Sun, 5 May 2013 19:55:58 +0000 (15:55 -0400)
src/calibcant/conclusions.tex
src/calibcant/discussion.tex
src/pyafm/main.bib

index dd2460a492018b33ccb9aef9c0a7a0c59bc6931f..3f29e1bca0925306d2b9e623bce30143ff7a9a8d 100644 (file)
@@ -10,5 +10,5 @@ by the notice of calibration experts\citep{hutter93-erratum} or
 incorrect formul\ae\ are used during the fitting
 (\cref{sec:calibcant:lorentzian}).  By centralizing calibration
 procedures in an open package, \calibcant\ should both reduce the
-effort needed to calibrate AFM cantilevers and improve the quality of
-the calibration.
+effort needed to calibrate AFM cantilevers, improve the quality of the
+calibration, and ease data sharing and archival.
index 721edbd18fee6a8e24e16777f5048641b5792270..97e0ef6809b85667ca0e274afdd4a0fe6a4d93a8 100644 (file)
@@ -160,4 +160,31 @@ the calculated $\kappa$.
 \subsection{Archiving experimental data}
 \label{sec:calibcant:discussion:data}
 
-TODO
+Scientific data is not thrown away after analysis.  Organizations may
+have standards for archival, and many journals require supporting data
+to be available on request for a number of years after
+publication\citep{TODO}.  Both the raw data and the experimental
+parameters used to collect need to be preserved, but managing this
+manually is tedious and error prone.  Lab notebooks rarely contain
+\emph{all} of the parameters used to collect and analyze a particular
+calibration.  Data collected with \calibcant\ is saved in
+\citetalias{hdf5} with the full configuration
+(\cref{sec:pyafm:h5config}), bundling all of the information together
+in a single file.
+
+One minor drawback to this approach is that configuration information
+(which is not likely to change often) is duplicated between
+calibration runs.  While this uses some extra disk space, the overhead
+is small.  The full calibration datafile weighs in at $3.4\U{MB}$,
+while the calibration section alone is just $37\U{kB}$ (1\% of the
+total).
+
+Besides the benefit of having a self contained file, HDF5 provides
+efficient support for large arrays of typed data (such as the unsigned
+16-bit values from our DACs and ADCs), which is not possible with many
+other open file formats.  The HDF libraries are supported by the
+non-profit HDF Group with a 20 year development
+history\citep{hdf-group} and many users\citep{hdf-users}.  This
+suggests that HDF will be around for the long haul, and if it is
+eventually phased out, that there will be a number of well funded
+organizations interested in developing migration plans.
index 8312c7745fb46b6718c263f3fae7789409722d60..95971ead506a40eaa690b130586caa52b474725e 100644 (file)
   note = {Version 1.8.10},
 }
 
+@misc{ hdf-group,
+  author = HDFG,
+  title = {HDF Group History},
+  year = 2013,
+  url = {http://www.hdfgroup.org/about/history.html},
+}
+
+@misc{ hdf-users,
+  author = HDFG,
+  title = {Who uses HDF?},
+  year = 2013,
+  url = {http://www.hdfgroup.org/users.html},
+}
+
 @misc{ yaml,
   title = {{YAML} Ain't Markup Language ({YAML\texttrademark})
     Version 1.2},