Re: Questions about importing mail (mbox)
authorMueen Nawaz <mueen@nawaz.org>
Tue, 22 Mar 2011 02:02:45 +0000 (19:02 +1700)
committerW. Trevor King <wking@tremily.us>
Fri, 7 Nov 2014 17:38:01 +0000 (09:38 -0800)
ef/2afc3c1f7a5425aa3bc8c8b6e4b1c53b0336b6 [new file with mode: 0644]

diff --git a/ef/2afc3c1f7a5425aa3bc8c8b6e4b1c53b0336b6 b/ef/2afc3c1f7a5425aa3bc8c8b6e4b1c53b0336b6
new file mode 100644 (file)
index 0000000..e571e93
--- /dev/null
@@ -0,0 +1,114 @@
+Return-Path: <gmn-notmuch@m.gmane.org>\r
+X-Original-To: notmuch@notmuchmail.org\r
+Delivered-To: notmuch@notmuchmail.org\r
+Received: from localhost (localhost [127.0.0.1])\r
+       by olra.theworths.org (Postfix) with ESMTP id BC5B6429E20\r
+       for <notmuch@notmuchmail.org>; Mon, 21 Mar 2011 19:04:27 -0700 (PDT)\r
+X-Virus-Scanned: Debian amavisd-new at olra.theworths.org\r
+X-Spam-Flag: NO\r
+X-Spam-Score: 0\r
+X-Spam-Level: \r
+X-Spam-Status: No, score=0 tagged_above=-999 required=5 tests=[none]\r
+       autolearn=disabled\r
+Received: from olra.theworths.org ([127.0.0.1])\r
+       by localhost (olra.theworths.org [127.0.0.1]) (amavisd-new, port 10024)\r
+       with ESMTP id KXjvDmGUB36o for <notmuch@notmuchmail.org>;\r
+       Mon, 21 Mar 2011 19:04:26 -0700 (PDT)\r
+Received: from lo.gmane.org (lo.gmane.org [80.91.229.12])\r
+       by olra.theworths.org (Postfix) with ESMTP id 8D41D431FD0\r
+       for <notmuch@notmuchmail.org>; Mon, 21 Mar 2011 19:04:26 -0700 (PDT)\r
+Received: from list by lo.gmane.org with local (Exim 4.69)\r
+       (envelope-from <gmn-notmuch@m.gmane.org>) id 1Q1qxC-0003BK-U8\r
+       for notmuch@notmuchmail.org; Tue, 22 Mar 2011 03:04:14 +0100\r
+Received: from c-71-237-233-41.hsd1.or.comcast.net ([71.237.233.41])\r
+       by main.gmane.org with esmtp (Gmexim 0.1 (Debian))\r
+       id 1AlnuQ-0007hv-00\r
+       for <notmuch@notmuchmail.org>; Tue, 22 Mar 2011 03:04:14 +0100\r
+Received: from mueen by c-71-237-233-41.hsd1.or.comcast.net with local (Gmexim\r
+       0.1 (Debian)) id 1AlnuQ-0007hv-00\r
+       for <notmuch@notmuchmail.org>; Tue, 22 Mar 2011 03:04:14 +0100\r
+X-Injected-Via-Gmane: http://gmane.org/\r
+To: notmuch@notmuchmail.org\r
+From: Mueen Nawaz <mueen@nawaz.org>\r
+Subject: Re: Questions about importing mail (mbox)\r
+Date: Mon, 21 Mar 2011 19:02:45 -0700\r
+Lines: 56\r
+Message-ID: <87hbavlxoa.fsf@fester.com>\r
+References: <87bp15m9oz.fsf@fester.com>\r
+       <87zkooo88x.fsf@A7GMS.i-did-not-set--mail-host-address--so-tickle-me>\r
+Mime-Version: 1.0\r
+Content-Type: text/plain; charset=us-ascii\r
+X-Complaints-To: usenet@dough.gmane.org\r
+X-Gmane-NNTP-Posting-Host: c-71-237-233-41.hsd1.or.comcast.net\r
+Cancel-Lock: sha1:UCoiTIrgg/2RtGaCCdMlXQ7uo5o=\r
+X-BeenThere: notmuch@notmuchmail.org\r
+X-Mailman-Version: 2.1.13\r
+Precedence: list\r
+List-Id: "Use and development of the notmuch mail system."\r
+       <notmuch.notmuchmail.org>\r
+List-Unsubscribe: <http://notmuchmail.org/mailman/options/notmuch>,\r
+       <mailto:notmuch-request@notmuchmail.org?subject=unsubscribe>\r
+List-Archive: <http://notmuchmail.org/pipermail/notmuch>\r
+List-Post: <mailto:notmuch@notmuchmail.org>\r
+List-Help: <mailto:notmuch-request@notmuchmail.org?subject=help>\r
+List-Subscribe: <http://notmuchmail.org/mailman/listinfo/notmuch>,\r
+       <mailto:notmuch-request@notmuchmail.org?subject=subscribe>\r
+X-List-Received-Date: Tue, 22 Mar 2011 02:04:27 -0000\r
+\r
+Pieter Praet <pieter@praet.org> writes:\r
+> It would've been a no-brainer if you'd been using Maildir all along\r
+> (mbox is evil incarnate), but...\r
+\r
+Sure, but mbox is too convenient.\r
+\r
+> I'd suggest keeping your original mbox file safe in git [1], and\r
+> consistently commiting every step of the way, so even if messages were\r
+> to get lost in translation, you still have a way to get them back, with\r
+> negligible storage overhead (just remember to "git gc --aggressive\r
+> --prune=now" when you're finished).\r
+\r
+I think you misunderstood me. A part of me suspects this has something\r
+to do with my not explaining myself, but who's to say?<G>\r
+\r
+I'm experimenting with notmuch, and if I can translate everything I\r
+currently do in mutt to notmuch, then I'll just dump mutt. The set of\r
+mboxes I have will remain archived, but for all future incoming email,\r
+I'll switch to MH or MailDir. So I don't actually need to put my old\r
+mboxes under revision control - I just need to save them somewhere.\r
+\r
+> For the actual conversion to Maildir (and any type of mail fetching in\r
+> general), I'd suggest using FDM [2], you'll never look back.\r
+\r
+Thanks - will take a look.\r
+\r
+> Regarding the significant discrepancy between processed and added files\r
+> in Notmuch: Could be dupes (e.g. mail to/cc/bcc yourself or mailing\r
+> lists, ending up in both Inbox and Sent), which are automatically\r
+> suppressed by Notmuch.\r
+\r
+It definitely was dupes. I didn't realize that notmuch did not keep\r
+track of dupes. \r
+\r
+So I wrote a Python script to go through the mboxes and do a count of\r
+only unique messages. Problem? I have over 1000 emails that don't have a\r
+Message-ID header (case invariant search). I could go over why that is,\r
+but suffice it to say that I hate Microsoft.<G>\r
+\r
+Once I remove all dupes, I get to within 300-400 of the count that\r
+notmuch provides. The remaining 1000+ emails do contain some dupes, and\r
+I can't find a convenient way to get an accurate count of unique emails\r
+from them, but at least now I'm in the ballpark, and a lot more\r
+confident.\r
+\r
+Incidentally, one reason I didn't realize dupes were the reason is that\r
+I did a search for a word in one email I had and notmuch did not find\r
+it - so I assumed it had not been indexed. Later on, I realized I had\r
+written a partial word and discovered that notmuch does find it if I\r
+type the full word.\r
+\r
+What am I doing wrong? Can't notmuch handle partial word matches? Do I\r
+need to specify an option to get that to work?\r
+\r
+Anyway, thanks for the help - I'll investigate further.\r
+\r
+\r