[Patch v6 4/6] restore: transparently support gzipped input
authorDavid Bremner <david@tethera.net>
Thu, 3 Apr 2014 19:41:21 +0000 (16:41 +2100)
committerW. Trevor King <wking@tremily.us>
Fri, 7 Nov 2014 18:01:10 +0000 (10:01 -0800)
77/1f4f20731d4917e4e76081a1b8921f6cfb05e8 [new file with mode: 0644]

diff --git a/77/1f4f20731d4917e4e76081a1b8921f6cfb05e8 b/77/1f4f20731d4917e4e76081a1b8921f6cfb05e8
new file mode 100644 (file)
index 0000000..61bbcda
--- /dev/null
@@ -0,0 +1,201 @@
+Return-Path: <bremner@tesseract.cs.unb.ca>\r
+X-Original-To: notmuch@notmuchmail.org\r
+Delivered-To: notmuch@notmuchmail.org\r
+Received: from localhost (localhost [127.0.0.1])\r
+       by olra.theworths.org (Postfix) with ESMTP id F3A9E431FCF\r
+       for <notmuch@notmuchmail.org>; Thu,  3 Apr 2014 19:43:32 -0700 (PDT)\r
+X-Virus-Scanned: Debian amavisd-new at olra.theworths.org\r
+X-Spam-Flag: NO\r
+X-Spam-Score: 0\r
+X-Spam-Level: \r
+X-Spam-Status: No, score=0 tagged_above=-999 required=5 tests=[none]\r
+       autolearn=disabled\r
+Received: from olra.theworths.org ([127.0.0.1])\r
+       by localhost (olra.theworths.org [127.0.0.1]) (amavisd-new, port 10024)\r
+       with ESMTP id Cx2eCdI3zupG for <notmuch@notmuchmail.org>;\r
+       Thu,  3 Apr 2014 19:43:27 -0700 (PDT)\r
+Received: from mx.xen14.node3324.gplhost.com (gitolite.debian.net\r
+       [87.98.215.224]) (using TLSv1 with cipher AES256-SHA (256/256 bits))\r
+       (No client certificate requested)\r
+       by olra.theworths.org (Postfix) with ESMTPS id 87296431FCB\r
+       for <notmuch@notmuchmail.org>; Thu,  3 Apr 2014 19:43:27 -0700 (PDT)\r
+Received: from remotemail by mx.xen14.node3324.gplhost.com with local (Exim\r
+       4.72) (envelope-from <bremner@tesseract.cs.unb.ca>)\r
+       id 1WVtWq-000174-1D; Fri, 04 Apr 2014 02:06:48 +0000\r
+Received: (nullmailer pid 4018 invoked by uid 1000); Thu, 03 Apr 2014\r
+       19:41:39 -0000\r
+From: David Bremner <david@tethera.net>\r
+To: notmuch@notmuchmail.org\r
+Subject: [Patch v6 4/6] restore: transparently support gzipped input\r
+Date: Thu,  3 Apr 2014 16:41:21 -0300\r
+Message-Id: <1396554083-3892-5-git-send-email-david@tethera.net>\r
+X-Mailer: git-send-email 1.9.0\r
+In-Reply-To: <1396554083-3892-1-git-send-email-david@tethera.net>\r
+References: <1396554083-3892-1-git-send-email-david@tethera.net>\r
+X-BeenThere: notmuch@notmuchmail.org\r
+X-Mailman-Version: 2.1.13\r
+Precedence: list\r
+List-Id: "Use and development of the notmuch mail system."\r
+       <notmuch.notmuchmail.org>\r
+List-Unsubscribe: <http://notmuchmail.org/mailman/options/notmuch>,\r
+       <mailto:notmuch-request@notmuchmail.org?subject=unsubscribe>\r
+List-Archive: <http://notmuchmail.org/pipermail/notmuch>\r
+List-Post: <mailto:notmuch@notmuchmail.org>\r
+List-Help: <mailto:notmuch-request@notmuchmail.org?subject=help>\r
+List-Subscribe: <http://notmuchmail.org/mailman/listinfo/notmuch>,\r
+       <mailto:notmuch-request@notmuchmail.org?subject=subscribe>\r
+X-List-Received-Date: Fri, 04 Apr 2014 02:43:33 -0000\r
+\r
+We rely completely on zlib to do the right thing in detecting gzipped\r
+input. Since our dump format is chosen to be 7 bit ascii, this should\r
+be fine.\r
+---\r
+ doc/man1/notmuch-restore.rst |  8 ++++++++\r
+ notmuch-restore.c            | 41 ++++++++++++++++++++++++++---------------\r
+ test/T240-dump-restore.sh    | 14 ++++++++++++++\r
+ 3 files changed, 48 insertions(+), 15 deletions(-)\r
+\r
+diff --git a/doc/man1/notmuch-restore.rst b/doc/man1/notmuch-restore.rst\r
+index d6cf19a..936b138 100644\r
+--- a/doc/man1/notmuch-restore.rst\r
++++ b/doc/man1/notmuch-restore.rst\r
+@@ -50,6 +50,14 @@ Supported options for **restore** include\r
+             format, this heuristic, based the fact that batch-tag format\r
+             contains no parentheses, should be accurate.\r
\r
++GZIPPED INPUT\r
++=============\r
++\r
++\ **notmuch restore** will detect if the input is compressed in\r
++**gzip(1)** format and automatically decompress it while reading. This\r
++detection does not depend on file naming and in particular works for\r
++standard input.\r
++\r
+ SEE ALSO\r
+ ========\r
\r
+diff --git a/notmuch-restore.c b/notmuch-restore.c\r
+index c54d513..eb5b7b2 100644\r
+--- a/notmuch-restore.c\r
++++ b/notmuch-restore.c\r
+@@ -22,6 +22,7 @@\r
+ #include "hex-escape.h"\r
+ #include "tag-util.h"\r
+ #include "string-util.h"\r
++#include "zlib-extra.h"\r
\r
+ static regex_t regex;\r
\r
+@@ -128,10 +129,9 @@ notmuch_restore_command (notmuch_config_t *config, int argc, char *argv[])\r
+     tag_op_list_t *tag_ops;\r
\r
+     char *input_file_name = NULL;\r
+-    FILE *input = stdin;\r
++    gzFile input;\r
+     char *line = NULL;\r
+     void *line_ctx = NULL;\r
+-    size_t line_size;\r
+     ssize_t line_len;\r
\r
+     int ret = 0;\r
+@@ -163,13 +163,23 @@ notmuch_restore_command (notmuch_config_t *config, int argc, char *argv[])\r
+     if (! accumulate)\r
+       flags |= TAG_FLAG_REMOVE_ALL;\r
\r
+-    if (input_file_name) {\r
+-      input = fopen (input_file_name, "r");\r
+-      if (input == NULL) {\r
+-          fprintf (stderr, "Error opening %s for reading: %s\n",\r
+-                   input_file_name, strerror (errno));\r
++    if (input_file_name)\r
++      input = gzopen (input_file_name, "r");\r
++    else {\r
++      int infd = dup (STDIN_FILENO);\r
++      if (infd < 0) {\r
++          fprintf (stderr, "Error duping stdin\n");\r
+           return EXIT_FAILURE;\r
+       }\r
++      input = gzdopen (infd, "r");\r
++      if (! input)\r
++          close (infd);\r
++    }\r
++\r
++    if (input == NULL) {\r
++      fprintf (stderr, "Error opening %s for (gzip) reading: %s\n",\r
++               input_file_name ? input_file_name : "stdin", strerror (errno));\r
++      return EXIT_FAILURE;\r
+     }\r
\r
+     if (opt_index < argc) {\r
+@@ -184,12 +194,17 @@ notmuch_restore_command (notmuch_config_t *config, int argc, char *argv[])\r
+     }\r
\r
+     do {\r
+-      line_len = getline (&line, &line_size, input);\r
++      util_status_t status;\r
++\r
++      status = gz_getline (line_ctx, &line, &line_len, input);\r
\r
+       /* empty input file not considered an error */\r
+-      if (line_len < 0)\r
++      if (status == UTIL_EOF)\r
+           return EXIT_SUCCESS;\r
\r
++      if (status)\r
++          return EXIT_FAILURE;\r
++\r
+     } while ((line_len == 0) ||\r
+            (line[0] == '#') ||\r
+            /* the cast is safe because we checked about for line_len < 0 */\r
+@@ -254,7 +269,7 @@ notmuch_restore_command (notmuch_config_t *config, int argc, char *argv[])\r
+       if (ret)\r
+           break;\r
\r
+-    }  while ((line_len = getline (&line, &line_size, input)) != -1);\r
++    }  while (gz_getline (line_ctx, &line, &line_len, input) == UTIL_SUCCESS);\r
\r
+     if (line_ctx != NULL)\r
+       talloc_free (line_ctx);\r
+@@ -262,13 +277,9 @@ notmuch_restore_command (notmuch_config_t *config, int argc, char *argv[])\r
+     if (input_format == DUMP_FORMAT_SUP)\r
+       regfree (&regex);\r
\r
+-    if (line)\r
+-      free (line);\r
+-\r
+     notmuch_database_destroy (notmuch);\r
\r
+-    if (input != stdin)\r
+-      fclose (input);\r
++    gzclose_r (input);\r
\r
+     return ret ? EXIT_FAILURE : EXIT_SUCCESS;\r
+ }\r
+diff --git a/test/T240-dump-restore.sh b/test/T240-dump-restore.sh\r
+index b6d8602..efe463e 100755\r
+--- a/test/T240-dump-restore.sh\r
++++ b/test/T240-dump-restore.sh\r
+@@ -80,6 +80,20 @@ notmuch dump --gzip --output=dump-gzip-outfile.gz\r
+ gunzip dump-gzip-outfile.gz\r
+ test_expect_equal_file dump.expected dump-gzip-outfile\r
\r
++test_begin_subtest "restoring gzipped stdin"\r
++notmuch dump --gzip --output=backup.gz\r
++notmuch tag +new_tag '*'\r
++notmuch restore < backup.gz\r
++notmuch dump --output=dump.actual\r
++test_expect_equal_file dump.expected dump.actual\r
++\r
++test_begin_subtest "restoring gzipped file"\r
++notmuch dump --gzip --output=backup.gz\r
++notmuch tag +new_tag '*'\r
++notmuch restore --input=backup.gz\r
++notmuch dump --output=dump.actual\r
++test_expect_equal_file dump.expected dump.actual\r
++\r
+ # Note, we assume all messages from cworth have a message-id\r
+ # containing cworth.org\r
\r
+-- \r
+1.9.0\r
+\r