<p dir="ltr">Python + BeautifulSoup (module) + Requests (module) = go fish!</p>
<div class="gmail_quote">On Mar 10, 2014 11:31 AM, "Shane Trent" <<a href="mailto:shanedtrent@gmail.com">shanedtrent@gmail.com</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div dir="ltr">I am looking for pointers at attempting what I hope will be a very simple web scraping project. Our elementary school has a newsletter that has every article under a separate link, requiring 15 clicks to read the whole newsletter. Not a great UI experience in my option. Here is an example newsletter.<div>

<br></div><div><a href="http://www.tmsacademy.org/index.php?option=com_content&view=category&id=120&Itemid=553" target="_blank">http://www.tmsacademy.org/index.php?option=com_content&view=category&id=120&Itemid=553</a><br>

</div><div><br></div><div>I would like to find a way to get all of the newsletter content on a single page (and learn a few "teach a man to fish" skills). Pulling into a local document would be acceptable but I would like to be able to share the single page view with other parents at the school. I am not sure of the best way to do this either!</div>

<div><br></div><div>A casual web-search points to Python and a few extensions but most references I found target data harvesting. I wonder if there is a simpler approach. </div><div><br></div><div>I suspect Carl can point me in the right direction but wanted to shout-out to the list on the chance that someone has already done something similar. </div>

<div><br></div><div>Thanks,</div><div>Shane</div><div><br></div><div><br></div></div>
<br>_______________________________________________<br>
Triangle, NC Embedded Computing mailing list<br>
<a href="mailto:TriEmbed@triembed.org">TriEmbed@triembed.org</a><br>
<a href="http://mail.triembed.org/mailman/listinfo/triembed_triembed.org" target="_blank">http://mail.triembed.org/mailman/listinfo/triembed_triembed.org</a><br>
TriEmbed web site: <a href="http://TriEmbed.org" target="_blank">http://TriEmbed.org</a><br>
<br></blockquote></div>