Convert buffer(...) -> bytes(...) for Python 3 compatibility.

[igor.git] / igor / packed.py
diff --git a/igor/packed.py b/igor/packed.py

index ebcbdfc4764ea96a26752649851944cea211c663..da773bba543634689442b197d9b71295064f8192 100644 (file)
--- a/igor/packed.py
+++ b/igor/packed.py
@@ -1,95 +1,37 @@
-# Copyright
+# Copyright (C) 2012 W. Trevor King <wking@tremily.us>
+#
+# This file is part of igor.
+#
+# igor is free software: you can redistribute it and/or modify it under the
+# terms of the GNU Lesser General Public License as published by the Free
+# Software Foundation, either version 3 of the License, or (at your option) any
+# later version.
+#
+# igor is distributed in the hope that it will be useful, but WITHOUT ANY
+# WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR
+# A PARTICULAR PURPOSE.  See the GNU Lesser General Public License for more
+# details.
+#
+# You should have received a copy of the GNU Lesser General Public License
+# along with igor.  If not, see <http://www.gnu.org/licenses/>.
  
-from io import BytesIO as _BytesIO
+"Read IGOR Packed Experiment files files into records."
  
-from .binarywave import load as _loadibw
+from . import LOG as _LOG
  from .struct import Structure as _Structure
  from .struct import Field as _Field
-
-"Read IGOR Packed Experiment files files into records."
-
-
-class Record (object):
-    def __init__(self, header, data):
-        self.header = header
-        self.data = data
-
-    def __str__(self):
-        return self.__repr__()
-
-    def __repr__(self):
-        return '<{} {}>'.format(self.__class__.__name__, id(self))
-
-
-class UnknownRecord (Record):
-    def __repr__(self):
-        return '<{}-{} {}>'.format(
-            self.__class__.__name__, self.header['recordType'], id(self))
-
-
-class UnusedRecord (Record):
-    pass
-
-
-class VariablesRecord (Record):
-    pass
-
-
-class HistoryRecord (Record):
-    pass
-
-
-class WaveRecord (Record):
-    def __init__(self, *args, **kwargs):
-        super(WaveRecord, self).__init__(*args, **kwargs)
-        self.wave = _loadibw(_BytesIO(bytes(self.data)), strict=False)
-
-    def __str__(self):
-        return str(self.wave)
-
-    def __repr__(self):
-        return str(self.wave)
-
-
-class RecreationRecord (Record):
-    pass
-
-
-class ProcedureRecord (Record):
-    pass
-
-
-class GetHistoryRecord (Record):
-    pass
-
-
-class PackedFileRecord (Record):
-    pass
-
-
-class FolderStartRecord (Record):
-    pass
-
-
-class FolderEndRecord (Record):
-    pass
-
-
-# From PackedFile.h
-RECORD_TYPE = {
-    0: UnusedRecord,
-    1: VariablesRecord,
-    2: HistoryRecord,
-    3: WaveRecord,
-    4: RecreationRecord,
-    5: ProcedureRecord,
-    6: UnusedRecord,
-    7: GetHistoryRecord,
-    8: PackedFileRecord,
-    9: FolderStartRecord,
-    10: FolderEndRecord,
-    }
-
+from .util import byte_order as _byte_order
+from .util import need_to_reorder_bytes as _need_to_reorder_bytes
+from .record import RECORD_TYPE as _RECORD_TYPE
+from .record.base import UnknownRecord as _UnknownRecord
+from .record.base import UnusedRecord as _UnusedRecord
+from .record.folder import FolderStartRecord as _FolderStartRecord
+from .record.folder import FolderEndRecord as _FolderEndRecord
+from .record.variables import VariablesRecord as _VariablesRecord
+from .record.wave import WaveRecord as _WaveRecord
+
+
+# From PTN003:
  # Igor writes other kinds of records in a packed experiment file, for
  # storing things like pictures, page setup records, and miscellaneous
  # settings.  The format for these records is quite complex and is not
@@ -113,29 +55,129 @@ SUPERCEDED_MASK = 0x8000  # Bit is set if the record is superceded by
  
  
  def load(filename, strict=True, ignore_unknown=True):
+    _LOG.debug('loading a packed experiment file from {}'.format(filename))
      records = []
      if hasattr(filename, 'read'):
          f = filename  # filename is actually a stream object
      else:
          f = open(filename, 'rb')
+    byte_order = None
+    initial_byte_order = '='
      try:
          while True:
-            PackedFileRecordHeader.set_byte_order('=')
-            b = buffer(f.read(PackedFileRecordHeader.size))
+            PackedFileRecordHeader.byte_order = initial_byte_order
+            PackedFileRecordHeader.setup()
+            b = bytes(f.read(PackedFileRecordHeader.size))
              if not b:
                  break
-            header = PackedFileRecordHeader.unpack_dict_from(b)
-            data = buffer(f.read(header['numDataBytes']))
-            record_type = RECORD_TYPE.get(
-                header['recordType'] & PACKEDRECTYPE_MASK, UnknownRecord)
-            if record_type in [UnknownRecord, UnusedRecord
+            if len(b) < PackedFileRecordHeader.size:
+                raise ValueError(
+                    ('not enough data for the next record header ({} < {})'
+                     ).format(len(b), PackedFileRecordHeader.size))
+            _LOG.debug('reading a new packed experiment file record')
+            header = PackedFileRecordHeader.unpack_from(b)
+            if header['version'] and not byte_order:
+                need_to_reorder = _need_to_reorder_bytes(header['version'])
+                byte_order = initial_byte_order = _byte_order(need_to_reorder)
+                _LOG.debug(
+                    'get byte order from version: {} (reorder? {})'.format(
+                        byte_order, need_to_reorder))
+                if need_to_reorder:
+                    PackedFileRecordHeader.byte_order = byte_order
+                    PackedFileRecordHeader.setup()
+                    header = PackedFileRecordHeader.unpack_from(b)
+                    _LOG.debug(
+                        'reordered version: {}'.format(header['version']))
+            data = bytes(f.read(header['numDataBytes']))
+            if len(data) < header['numDataBytes']:
+                raise ValueError(
+                    ('not enough data for the next record ({} < {})'
+                     ).format(len(b), header['numDataBytes']))
+            record_type = _RECORD_TYPE.get(
+                header['recordType'] & PACKEDRECTYPE_MASK, _UnknownRecord)
+            _LOG.debug('the new record has type {} ({}).'.format(
+                    record_type, header['recordType']))
+            if record_type in [_UnknownRecord, _UnusedRecord
                                 ] and not ignore_unknown:
                  raise KeyError('unkown record type {}'.format(
                          header['recordType']))
-            records.append(record_type(header, data))
+            records.append(record_type(header, data, byte_order=byte_order))
      finally:
+        _LOG.debug('finished loading {} records from {}'.format(
+                len(records), filename))
          if not hasattr(filename, 'read'):
              f.close()
  
-    return records
-
+    filesystem = _build_filesystem(records)
+
+    return (records, filesystem)
+
+def _build_filesystem(records):
+    # From PTN003:
+    """The name must be a valid Igor data folder name. See Object
+    Names in the Igor Reference help file for name rules.
+
+    When Igor Pro reads the data folder start record, it creates a new
+    data folder with the specified name. Any subsequent variable, wave
+    or data folder start records cause Igor to create data objects in
+    this new data folder, until Igor Pro reads a corresponding data
+    folder end record."""
+    # From the Igor Manual, chapter 2, section 8, page II-123
+    # http://www.wavemetrics.net/doc/igorman/II-08%20Data%20Folders.pdf
+    """Like the Macintosh file system, Igor Pro's data folders use the
+    colon character (:) to separate components of a path to an
+    object. This is analogous to Unix which uses / and Windows which
+    uses \. (Reminder: Igor's data folders exist wholly in memory
+    while an experiment is open. It is not a disk file system!)
+
+    A data folder named "root" always exists and contains all other
+    data folders.
+    """
+    # From the Igor Manual, chapter 4, page IV-2
+    # http://www.wavemetrics.net/doc/igorman/IV-01%20Commands.pdf
+    """For waves and data folders only, you can also use "liberal"
+    names. Liberal names can include almost any character, including
+    spaces and dots (see Liberal Object Names on page III-415 for
+    details).
+    """
+    # From the Igor Manual, chapter 3, section 16, page III-416
+    # http://www.wavemetrics.net/doc/igorman/III-16%20Miscellany.pdf
+    """Liberal names have the same rules as standard names except you
+    may use any character except control characters and the following:
+
+      " ' : ;
+    """
+    filesystem = {'root': {}}
+    dir_stack = [('root', filesystem['root'])]
+    for record in records:
+        cwd = dir_stack[-1][-1]
+        if isinstance(record, _FolderStartRecord):
+            name = record.null_terminated_text
+            cwd[name] = {}
+            dir_stack.append((name, cwd[name]))
+        elif isinstance(record, _FolderEndRecord):
+            dir_stack.pop()
+        elif isinstance(record, (_VariablesRecord, _WaveRecord)):
+            if isinstance(record, _VariablesRecord):
+                sys_vars = record.variables['variables']['sysVars'].keys()
+                for filename,value in record.namespace.items():
+                    if len(dir_stack) > 1 and filename in sys_vars:
+                        # From PTN003:
+                        """When reading a packed file, any system
+                        variables encountered while the current data
+                        folder is not the root should be ignored.
+                        """
+                        continue
+                    _check_filename(dir_stack, filename)
+                    cwd[filename] = value
+            else:  # WaveRecord
+                filename = record.wave['wave']['wave_header']['bname']
+                _check_filename(dir_stack, filename)
+                cwd[filename] = record
+    return filesystem
+
+def _check_filename(dir_stack, filename):
+    cwd = dir_stack[-1][-1]
+    if filename in cwd:
+        raise ValueError('collision on name {} in {}'.format(
+                filename, ':'.join(d for d,cwd in dir_stack)))