encoding of message-ids
authorDavid Bremner <david@tethera.net>
Tue, 16 Feb 2016 12:38:09 +0000 (08:38 +2000)
committerW. Trevor King <wking@tremily.us>
Sat, 20 Aug 2016 23:21:08 +0000 (16:21 -0700)
5d/79c340780b6613a838bfb0a2041dbd3075db54 [new file with mode: 0644]

diff --git a/5d/79c340780b6613a838bfb0a2041dbd3075db54 b/5d/79c340780b6613a838bfb0a2041dbd3075db54
new file mode 100644 (file)
index 0000000..73da1c4
--- /dev/null
@@ -0,0 +1,58 @@
+Return-Path: <david@tethera.net>\r
+X-Original-To: notmuch@notmuchmail.org\r
+Delivered-To: notmuch@notmuchmail.org\r
+Received: from localhost (localhost [127.0.0.1])\r
+ by arlo.cworth.org (Postfix) with ESMTP id F329A6DE141B\r
+ for <notmuch@notmuchmail.org>; Tue, 16 Feb 2016 04:38:19 -0800 (PST)\r
+X-Virus-Scanned: Debian amavisd-new at cworth.org\r
+X-Spam-Flag: NO\r
+X-Spam-Score: -0.307\r
+X-Spam-Level: \r
+X-Spam-Status: No, score=-0.307 tagged_above=-999 required=5 tests=[AWL=0.244,\r
+  RP_MATCHES_RCVD=-0.55, SPF_PASS=-0.001] autolearn=disabled\r
+Received: from arlo.cworth.org ([127.0.0.1])\r
+ by localhost (arlo.cworth.org [127.0.0.1]) (amavisd-new, port 10024)\r
+ with ESMTP id 3zhaJlOONEfc for <notmuch@notmuchmail.org>;\r
+ Tue, 16 Feb 2016 04:38:13 -0800 (PST)\r
+Received: from fethera.tethera.net (fethera.tethera.net [198.245.60.197])\r
+ by arlo.cworth.org (Postfix) with ESMTPS id AF4B46DE02C9\r
+ for <notmuch@notmuchmail.org>; Tue, 16 Feb 2016 04:38:13 -0800 (PST)\r
+Received: from remotemail by fethera.tethera.net with local (Exim 4.84)\r
+ (envelope-from <david@tethera.net>)\r
+ id 1aVesi-0002It-RF; Tue, 16 Feb 2016 07:37:28 -0500\r
+Received: (nullmailer pid 23250 invoked by uid 1000);\r
+ Tue, 16 Feb 2016 12:38:09 -0000\r
+From: David Bremner <david@tethera.net>\r
+To: notmuch@notmuchmail.org\r
+Subject: encoding of message-ids\r
+User-Agent: Notmuch/0.21+26~g9404723 (http://notmuchmail.org) Emacs/24.5.1\r
+ (x86_64-pc-linux-gnu)\r
+Date: Tue, 16 Feb 2016 08:38:09 -0400\r
+Message-ID: <87si0svnim.fsf@zancas.localnet>\r
+MIME-Version: 1.0\r
+Content-Type: text/plain\r
+X-BeenThere: notmuch@notmuchmail.org\r
+X-Mailman-Version: 2.1.20\r
+Precedence: list\r
+List-Id: "Use and development of the notmuch mail system."\r
+ <notmuch.notmuchmail.org>\r
+List-Unsubscribe: <https://notmuchmail.org/mailman/options/notmuch>,\r
+ <mailto:notmuch-request@notmuchmail.org?subject=unsubscribe>\r
+List-Archive: <http://notmuchmail.org/pipermail/notmuch/>\r
+List-Post: <mailto:notmuch@notmuchmail.org>\r
+List-Help: <mailto:notmuch-request@notmuchmail.org?subject=help>\r
+List-Subscribe: <https://notmuchmail.org/mailman/listinfo/notmuch>,\r
+ <mailto:notmuch-request@notmuchmail.org?subject=subscribe>\r
+X-List-Received-Date: Tue, 16 Feb 2016 12:38:20 -0000\r
+\r
+\r
+I spent a little time this morning staring at the code, and it seems\r
+that all of the message-ids are parsed via g_mime_decode_text, which\r
+deals with RFC2047 encodings and makes guesses at decoding 8bit\r
+characters. In practice this means that in the notmuch database all\r
+headers are UTF-8. Since message-id's are supposed to be printable ascii\r
+[at least in rfc5322], this seems like not such a terrible decision, but\r
+I wonder if we should document this potential conversion somewhere?\r
+\r
+d\r
+\r