BJ Data Tech Solution

Specialized on Data processing, Data management Implementation plan, Data Collection tools - electronic and paper base, Data cleaning specifications, Data extraction, Data transformation, Data load, Analytical Datasets, and Data analysis. BJ Data Tech Solutions teaches on design and developing Electronic Data Collection Tools using CSPro, and STATA commands for data manipulation. Setting up Data Management systems using modern data technologies such as Relational Databases, C#, PHP and Android.

Analysing duplicates
Analysing duplicates

Hi guys,

I need to analyse duplicates. I've got different newpaper articles. They all have a story_id. These articles mention different EU and US companies. First I need to analyse how many companies are mentioned in one article. For that I used:

Code:

duplicates tag rp_story_id, gen(dup_storyid)

Second I need to analyse how many US and Non-US companies (country_code=="US") are mentioned each year.

Example:

company country_code story_id headline year
VW DE NDJHAODUW Earnings announcement 3. Qu 2003
BMW DE NDJHAODUW Earnings announcement 3. QU 2003
GM US NDJHAODUW Earnings announcement 3. Qu 2003
VW DE SODOEIKDIDI Earnings announcement 1. Qu 2004
GM US SODOEIKDIDI Earnings announcement 1. Qu 2004

Code:

duplicates tag rp_story_id, gen(dup_storyid)
gen continent=0
replace continent=1 if country_code!="US"
tab dup_storyid continent

Any suggestions how I could continue?

BJ Data Tech Solution

Home / Data Cleaning / Data management / Data Processing / Analysing duplicates
Analysing duplicates

0 Response to Analysing duplicates

Post a Comment

Home / Data Cleaning / Data management / Data Processing / Analysing duplicates Analysing duplicates

Related Posts with Analysing duplicates

0 Response to Analysing duplicates